Advanced Search
Published: Jul 23, 2021 DOI: 10.21769/BioProtoc.1010633 Views: 2835
研究背景
推断生物类群的系统发生关系和分异时间是分支系统学分析的基础。如何合理利用化石的形态和地质年代数据来完成此类推断一直是一个棘手的问题。近些年开发的贝叶斯支端定年法 (Bayesian tip dating) 为该问题提供了一个可行的解决方案。支端定年法把化石形态和年代数据整合在一次完整的计算过程中,能够尽可能充分地利用数据信息,同时考虑了树的拓扑结构、分异时间、演化速率以及化石年代的不确定性。该方法通过统计模型来描述特征演化、类群生灭、化石采样等过程,并借助相对成熟的贝叶斯统计框架和计算方法来进行参数估计和模型选择。
本文着重分析离散的形态特征数据,这类数据是支端定年法的数据核心。除了形态特征之外,支端定年法法还可以结合现生类群的分子序列数据。这类整合的数据分析也被称为全证据定年 (total-evidence tip dating) (Ronquist et al., 2012; Gavryushkina et al., 2014; Zhang et al., 2016)。使用MrBayes进行全证据定年分析的流程可以参考另一篇教程
下面按照MrBayes命令的顺序,首先设置描述特征状态演替的Mk模型
仪器设备
软件信息
MrBayes目前最新的版本为3.2.7,可以从如下GitHub链接下载:https://github.com/NBISweden/MrBayes/releases。下载后找到可执行文件,放在任意所需的目录下即可。此外,软件也可以从源代码自行编译,INSTALL文件中提供了具体方法,不在此处赘述。
图1. Windows命令提示符和macOS终端的界面
操作步骤
小结与建议
本文演示了如何利用MrBayes进行贝叶斯支端定年分析。大致流程主要包括下载软件,准备数据,准备命令文件、运行软件和查看结果。
由于MCMC算法是随机的计算机方法,因此每次计算的结果多少会有不同。理想情况下,不管哪次运算都是对真实后验分布的估计,因此,不同独立运算的结果应该相差不大。这可以通过比较两次运算的参数样本 (如使用Tracer软件打开 .p结尾的文 件),同时参考ASDSF和ESS值。
如果发现两次运算的结果差异很大,很可能MCMC算法还没有收敛 (convergence),或者不同运算卡在了后验分布的不同峰值附近导致混合 (mixing) 很差。前者一般可以通过增加MCMC链长 (ngen) 来改善。后者则相对困难,有时通过增加热链个数 (nchain) 并调整热链温度 (temperature) 能改善,但大多数情况下需要调整模型和先验的设置,选择更合理的模型往往能改善后验分布的形状,从而使MCMC能够更快收敛并很好混合。
致谢
感谢bio-protocol 的编辑工作以及同行专家的宝贵修改意见。
参考文献
Do you have any questions about this protocol?
Post your question to gather feedback from the community. We will also invite the authors of this article to respond.
Tips for asking effective questions
+ Description
Write a detailed description. Include all information that will help others answer your question including experimental processes, conditions, and relevant images.
Share
Bluesky
X
Copy link