计算分子进化-学习笔记1

最近做了些分子进化相关的分析,为了保证自己分析相对靠谱些,因此找了杨子恒编写的【计算分子进化】学习。

成对序列比较的距离估计被反复发现,关键点是,马尔科夫链, 核苷酸之间的置换速率,不同位置的置换速率。估算距离的几类模型

  • 先预设模型,然后使用伽马分布考虑不同位置的置换率
  • 极大似然估计
  • 广义时间可逆模型(GTR/REV)

并不是越复杂的模型效果越好。尤其是当序列间的差异过大时(>40%), 结果会更容易受到模型参数影响。

系统发育重建主要分为两大类,一类是先成对计算序列间距离,构建距离矩阵,然后建树,如简约法; 一类是基于序列的性状(氨基酸,核苷酸)来构树,使得所有物种的所有点都符合树的形状,如极大似然法,贝叶斯法。

物种分歧时间估算的理论基础是分子钟。基本假设是两条序列的差异随着分歧时间线性增加,当有外部校准信息时,可以将序列间的距离或者枝长转换为分歧时间。