Advanced Search
*Contributed equally to this work Published: Aug 20, 2022 DOI: 10.21769/BioProtoc.2204656 Views: 2066
仪器设备
目前Linux(如Ubuntu、CentOS、RedHat等)、Mac OS和Windows 10/11内置的WSL(Windows Subsystem for Linux)等操作系统均能够支持PMS。
PMS仅需要具有约2GB内存的标准计算机即可支持其安装与执行。为了更好的体验和更快的计算,我们推荐在具有8GB以上内存和4核3.3Ghz以上CPU的标准计算机上使用PMS。
软件
PMS软件最新版本为3.7。该软件主要由C++和R语言开发编写。
C++语言的支持需要安装C++编译器(例如g++)。对于Linux操作系统,大多版本已经在系统中安装了g++。对于Mac OS,建议从App Store安装Xcode应用程序,即可完成编译器的安装与配置。
R语言需要安装r-base提供运行环境。对于Linux操作系统,可以使用系统自带的包管理工具安装r-base。对于Mac OS,建议从App Store安装RStudio应用程序,即可完成R运行环境的安装与配置。
vsearch已经内置于PMS中,版本号为2.15.1。如果想要手动安装或更新,请从https://sourceforge.net/projects/vsearch/下载,并放置“vsearch”于$ParallelMETA/bin/ 目录下。
实验步骤
Sample1 | /home/data/sample1.fna |
Sample2 | /home/data/sample2.fna |
Sample3 | /home/data/sample3.fna |
SampleN | /home/data/sampleN.fna |
Sample1 | /home/data/sample1_end1.fna |
Sample1 | /home/data/sample1_end2.fna |
Sample2 | /home/data/sample2_end1.fna |
Sample2 | /home/data/sample2_end2.fna |
Sample_ID | IBD | Sex | Age |
Sample1 | Crohns | Female | 15 |
Sample2 | Crohns | Female | 31 |
Sample3 | Health | male | 29 |
文件/文件夹 | 内容 |
Index.html | 结果导览 |
Sample_Views (文件夹) | 群落结构可视化结果 |
Abundance_Tables (文件夹) | 样本丰度表 |
Distance_Matrix(文件夹) | 距离矩阵 |
Clustring(文件夹) | 聚类结果 |
Alpha_Diversity(文件夹) | Alpha多样性分析结果 |
Beta_Diversity(文件夹) | Beta多样性分析结果 |
Markers(文件夹) | 生物标记分析结果 |
Network(文件夹) | 共生网络分析结果 |
Single_Sample(文件夹) | 单个样本的群落结构及功能 |
Single_Sample.List(文件夹) | 样本中间结果列表 |
Analysis_Report.txt | 分析总结 |
script.sh | 分步工作流程脚本 |
error.log | 工作及错误日志 |
结果与分析
为了证明PMS在解码微生物组概况和将生态模式与关键meta数据联系起来的能力,这里选取了医院开业前后室内微生物组的变化验证。所有的数据集均可在 PMS 软件下载页面的“Supplementary”部分中下载。
该数据集包含894个来自医院开业前后室内环境的16S-扩增子微生物组样本。我们用所有的默认参数执行了PMS分析流程。从结果中我们可以观察到,医院开放后,α多样性的香农指数下降(图6A;Wilcoxon检验p值<0.01),整体群落的β多样性明显转变(图6B;加权Meta-Storms距离,PERMANOVA检验p值<0.01),均已被Lax等人(Lax等, 2017)验证过。两个时间点之间的这种微生物动态也可以通过相对丰度的变化来说明(图6C)。使用统计测试和机器学习分析方法,PMS还确定了有助于区分医院表面从开业前到开业后状态的这种生态变化的最重要的微生物,如葡萄球菌、莱茵海拉菌和莫德斯特菌。这个机器学习模型在区分室内样本(图6D)的属级状态方面达到了95.91%的准确率(误差率=4.09%)。
图6. 医院开业前后室内微生物组的变化
(A)医院开业后,α多样性的香农指数下降,Wilcoxon测试P值<0.01(P值<0.05表示差异显著);(B)根据加权的Meta-Storms距离,开院前和开院后状态下的整体β多样性有显著差异,PERMANOVA检验P值<0.01(P值<0.05表示有显著差异);(C)两个时间点之间属水平的相对丰度的动态变化;(D)五种细菌属被选为可以区分两个时间点的生物标志物。X轴是随机森林模型产生的重要性得分(准确性的平均下降),该模型评估了每个生物标志物对区分不同医院状态的重要性
失败经验
问题1
安装提示:”make: g++: command not found”
问题原因:没有安装Parallel-Meta Suite所需要的g++编译器。
解决方法:根据不同的操作系统,利用相应的命令安装 g++,常见的操作系统:
Ubuntu Linux系统:sudo apt-get install g++
CentOS Linux系统:sudo yum install g++
Mac OS 系统:通过App Store安装Xcode应用程序
问题2
运行提示:”Please set the environment variable ParallelMETA to the directory”
问题原因:环境变量设置失败。
解决方法:请参考实验步骤 1.2.2 中手动配置环境变量的方法将 Parallel-Meta Suite 所需要的环境变量添加到配置文件中。
问题3
运行提示:”PM-pipeline: command not found”
问题原因:环境变量设置失败。
解决方法:请参考实验步骤 1.2.2 中手动配置环境变量的方法将 Parallel-Meta Suite 所需要的环境变量添加到配置文件中。
问题4
运行提示:”Error: Cannot open file: XXX”
问题原因:输入了错误的输入/输出文件路径。
解决方案:请检查正确的输入文件路径(可在输入时用Tab 键自动补全),并确保用户在输出路径下有足够的写权限。
问题5
运行提示:”Argument #X Error : Arguments must start with -”
问题原因:运行命令中所有参数选项名称必须以“-”开头。
解决方法:请检查第 X 个参数并更正。
问题6
运行提示:
vsearch: unrecognized option '--cluster_unoise'
Error: Cannot open file: ./Result/tmp/denoised
vsearch: unrecognized option '--uchime3_denovo'
Error: Cannot open file: ./Result/tmp/nonchimeras
vsearch: unrecognized option '--otutabout'
Profiling finished
Error: Open Mapping File error : ./Result/tmp/map_output.txt
问题原因:用户使用PMS软件时,系统自动调用了默认环境的vsearch,而该vsearch的版本与PMS中所需的vsearch版本(v2.15.1)不同。
解决方法:更换环境变量中vsearch变量值,或者更新默认环境下vsearch版本。
问题7
运行提示:
Installing package into ‘/usr/local/lib/R/site-library’ (as ‘lib’ is unspecified)
Warning in install.packages(p, dep = TRUE, repos = “http://cran.us.r-
project.org/”) :
'lib = “/usr/local/lib/R/site-library”' is not writable
Error in install.packages(p, dep = TRUE, repos = “http://cran.us.r-project.org/”) :
unable to install packages
问题原因:R包的安装存在问题,用户对该文件夹没有”写”权限,需要改变/usr/local/lib/R/site-library文件夹的权限或者更换R library位置。
解决方法:
方案一:增加文件夹权限
step1: 进入文件夹
cd /usr/local/lib/R
step2: 加权限
sudo chmod o+w site-library
step3: 检查权限
ls -l
step4: 输出行如下
drwxrwsrwx xxxxxxxxxx(省略) site-library
方案二:以管理员身份进入
step1: su root
step2: 输入密码进入
step3: 再次执行命令
问题8
运行提示:出现”Installing package into “usr/local/lib/R/site-library” (as lib is unspecifed)”之后出现很多代码,一直在刷新
问题原因:PMS画图依赖一些R包,这时是在安装R包。
解决方法:如果安装了很长时间R包还是没有下载好,建议用户更换下载R包的源(如清华)。打开Rscript文件夹下的config.R文件,更换usePackage函数
(文件中第13-17行)为以下内容:
usePackage <- function(p) {
if (!is.element(p, installed.packages()[,1]))
install.packages(p, dep=TRUE, repos=“https://mirrors.tuna.tsinghua.edu.cn/CRAN/”)
suppressWarnings(suppressMessages(invisible(require(p, character.only=TRUE))))
}
问题9
运行提示:randomForest包安装不成功,用”install.packages(“randomForest”,
dep=TRUE, repos=“https://mirrors.tuna.tsinghua.edu.cn/CRAN/”)”命令单独安
装后报错:-bash: syntax error near unexpected token ”randomForest”
问题原因:没有进入R环境就直接执行安装命令
解决方法:
step1:
输入R后回车
step2:
显示R version 3.6.x xxxxx等一系列提示信息后,输入
install.packages(“randomForest”, dep=TRUE,
repos=“https://mirrors.tuna.tsinghua.edu.cn/CRAN/”)
回车后根据提示进行操作就可以。
问题10
运行提示:
“There are 0 sequences in total
Profiling starts
Profiling finished
0 matches are parsed
0 taxonomy annotations are parsed out”
问题原因:在当前执行命令的路径下找不到seqs.list中的文件地址。
以PMS样例数据举例,执行命令地址为 /home/username,输入正确路径
/mnt/d/parallel-meta-suite/example/seqs.list(meta同理)后生成如下命令:
PM-pipeline -i /mnt/d/parallel-meta-suite/example/seqs.list -m /mnt/d/parallel-
meta-suite/example/meta.txt
但seqs.list样本地址为seqs/S0437C.fna,在当前执行命令地址/home/username
下找不到seqs/S0437C.fna,因此运行后会出现这种错误。
解决方法:
方案一:切换到seqs.list、meta.txt、seq文件夹所在的位置再次执行
PM-pipeline –i seqs.list –m meta.txt
方案二:更换seqs.list中每个样本的地址。按照前面的路径举例,如果
在/home/username下执行,那么seqs.list中S0437C样本对应的地址是
/mnt/d/parallel-meta-suite/example/seqs/S0437C.fna,其他同理。
问题11
运行提示:运行完成后,打开文件夹中PDF文件,显示PDF文件已损坏或
该文件可能已被移除至别处、修改或删除
问题原因:R包安装未成功导致调用相应R包时出错,无法画图,因此该文
件为空无法打开显示
解决方法:根据error.log文件中的报错,重新安装需要的R包。如果有很多
R包都未安装成功,建议按照前面换清华源的步骤操作后再次执行“Rscript
config.R”以重新安装R包。
问题12
运行提示:软件分析的结果中只有Phylum(门)和Genus(属)层的分析结果,能否直接得到样品全部分类层次的信息?
问题原因:PMS默认只输出Phylum(门)和Genus(属)层的分析结果,可以在分析参数中指定任意多个层次。
解决方法: 在3.1配置向导“Diversity”类别的“Taxonomy Level”项中,选中任意多个层次(图7);或者在PM-pipeline命令中,用“-L”参数指定任意多个层次。
图7. 配置向导中指定任意多个分类层次
致谢
本项工作得到了国家重点研发计划2021YFF0704500、国家自然科学基金31771463和32070086项目的支持。
参考文献
Do you have any questions about this protocol?
Post your question to gather feedback from the community. We will also invite the authors of this article to respond.
Tips for asking effective questions
+ Description
Write a detailed description. Include all information that will help others answer your question including experimental processes, conditions, and relevant images.
Share
Bluesky
X
Copy link