Advanced Search
Published: Jun 24, 2021 DOI: 10.21769/BioProtoc.2104000 Views: 2256
研究背景
微生物多样性分析中,物种注释是最为关键的步骤。对于微生物多样性分析,常使用16S rRNA基因或ITS序列,利用RDP Classifier (Wang et al., 2007) 等通过朴素贝叶斯算法对序列进行物种注释。功能微生物是指执行某一特定功能的一类微生物群体,比如产甲烷微生物、尿素分解微生物、氨氧化微生物、固氮微生物。与一般性微生物相比,功能微生物与生态位表型具有更直接的联系,更能反映出生态位的功能变化。因此研究功能微生物多样性,对于解析生态位的功能机制具有重要意义。功能微生物多样性研究中,常对某些关键功能基因进行测序分析。与16S rRNA基因或ITS基因相比,功能基因常具有多个不同拷贝,难以作为系统发育的标签基因,无法根据基因序列组成和相似特点直接进行物种注释,所以常用的RDP Classifier等算法无法适用于功能基因物种注释分析。GraftM (Boyd et al., 2018) 是用于功能基因注释的优秀软件,它通过对已知功能基因构建系统发育树 (含物种信息),然后将查询功能基因定位到系统发育树,根据树上位置和距离,注释查询功能基因物种信息。本文介绍了基于GraftM进行功能微生物的物种注释。
软件和数据库
实验步骤
一、安装Graftm程序
通过conda安装:
conda create -n graftm
conda activate graftm
conda install graftm -c bioconda
二、创建与更新功能基因数据库包










三、功能基因物种注释
运行程序:
graftM graft --forward query.fasta --graftm_package marker.genes.gpkg/ --output_directory query.graftm
graftM graft参数:
--forward;查询功能基因序列,fasta格式,必选
--graftm_package;构建好的数据库包,必选
--output;输出文件夹
--threads;线程数 (默认5)
--placements_cutoff confidence;置信截取值 (默认0.75)
结果与分析
导出文件夹query.graftm中query文件夹中query_read_tax.tsv文件。第一列为OTU (Feature) 编号,第二列为分类信息,如下所示 (图11):
图11. 运行结果
致谢
感谢中国农业科学院创新工程 (ASTIP-IAS12) 支持。
参考文献
Category
Systems Biology > Microbiomics
Do you have any questions about this protocol?
Post your question to gather feedback from the community. We will also invite the authors of this article to respond.
Share
Bluesky
X
Copy link