分子系统学编辑

分子系统学

分子系统学是指通过对生物大分子（蛋白质、核酸等）的结构、功能等的进化研究，来阐明生物各类群（包括已绝灭的生物类群）间的谱系发生关系，相对于经典的形态系统分类研究，由于生物大分子本身就是遗传信息的载体，含有庞大的信息量，且趋同效应弱，因而其结论更具可比性和客观性．尤为重要的是，一些缺乏形态性状的生物类群（如微生物和某些低等动、植物）中，它几乎成为探讨其系统演化关系的唯一手段。由于分子系统学的上述特点，自其诞生之日起，就逐渐在各种生物类群的系统发生研究中得到了广泛的应用．总的说来，迄今分子系统学的研究所获得的生物类群间亲缘关系的结果，大多都和经典的形态系统树相吻合．但是，在一些生物进化谱系不明或模糊关键环节上，它得出的结果却往往和形态系统学的推测大相径庭。

alignment)或其它的数学处理，如转变成遗传距离数据矩阵；通过一些遗传分析软件(常用的计算机软件如：PHYLIP J、PAI J、MEGA．随机选择的外类群，极有可能因为亲缘关系较远，导致所得结果的不确定性增大．因此，在选择外类群时，必须结合其它分类学上的证据，或者在做详细的系统发育研究之前，首先对所研究的内、外群的关系进行初步探讨，以便于选择较为理想的外类群．最理想的外类群应该是该内群的姐妹群，因为二者间拥有较多的共近裔性状．

目的基因的选择

分子系统学研究中目的基因的选择也是一个至关重要的问题．一般来说，要根据所研究的具体分类群选

择适宜的基因：在高级分类阶元(科级以上)间的系统发生分析中，选择一些在进化中较为保守的基因或基因

片段(如核编码的蛋白质(酶)基因、核糖体基因(18S rRNA基因、28S rRNA基因)等)；在较低级的分类阶元

间，可以选择进化速率较快的基因或基因片断(如某些核编码基因的内含子或转录间隔区(ITS)以及一些细

胞器基因(线粒体基因和叶绿体基因)等)．

当然，每一个具体的研究对象，可以选择的基因数目可以是多个的，至于哪些是最有效的，这通常要依据具体情况做比较分析后才能得出结论．条件允许的话，可以作多基因或多基因组合分析后寻求一致树来加以解决．有时针对某些涉及到多种层次分类阶元的复杂分类群时，还可以采取组合分析的方法：即推断位于系统树基部的深层次的谱系发生时，运用较保守的基因作为目的基因；推断位于系统树中段的谱系发生时，采用进化速率较为适中的基因；在系统树顶端的终端分类单元时，采用进化速率较快的基因．这样可以在不同阶层的演化关系中都获得可信的结果．

基因序列数据的比对

选择了适宜的目的基因并通过基因的扩增(PCR技术)和序列测定后，就获得了各个目标生物类群的

DNA序列数据，对所获得的同源DNA序列进行比对是分析中的关键环节．所谓比对是指通过插入间隔

(gaps)的方法，使不同长度的序列对齐达到长度一致，并确保序列中的同源位点都排列在同一位置．其中间

隔的处理对后续的系统学分析有明显的影响．序列比对目前通常基于以下二种原理：点标(dot plot)法和记分距阵(scoring ma仃ix)法．

对于分类群数目较少且序列较短的对位排列，用肉眼判断，手工排序就能完成．但随着序列数目和长度的增加，即多序列对位排列(multiple sequence alignment)的l难度随之增大．因而计算机程序已成为多序列比对必不可少的工具，CLUSTAL系列软件是目前较为常用的排序程序．当然，软件自动排序的结果不可避免地会出现一些偏差，在此情况下，肉眼辨别和基于某些序列结构特征(如rRNA基因的二级结构等)的手工校正成为一种重要的补充手段．另外处理某些得失位点(indels)和多次替换位点是排序中一个十分棘手的事情，此时往往需要借助个人积累的经验和相应的数学方法、设计统计学模式以估算发生多次替换的数目而加以修正．

基因树的构建方法

目前，构建基因树的方法很多，常用的主要有二大类：即距离法(distance method)、和具体性状法(dis—cretecharacter method)．前者是将序列数据转变成数据(遗传距离)矩阵，然后通过此数据矩阵构建系统树；后者直接分析序列上每个核苷酸位点所提供的信息构建系统树，它又包括最大简约法(MP)和最大似然法(ML )以及由ML法延伸的贝叶斯法(Bayesian method)．

距离法

该方法基于这样一种假设，即只要获得一组同源序列间的进化距离(遗传距离)，那么就可以重建这些序

列的进化历史．距离法中以邻接法(NJ)最为常用．NJ法是由Saitou和Nei(1987)提出，其原理是逐步寻找新

的近邻种类(序列)，使最终生成的分子树的遗传距离总长度为最小．该法虽并不检验所有可能的拓扑结

构，但在每阶段诸物种(序列)聚合时都要应用最小进化原理，故而被认为是ME的一种简化方法．

由于分析

程序大大简化，费时较少，适于分析较大的数据集，目前已成为距离法分析中最通用的一种方法．NJ法不包

含速率一致的假设，通过采用“校正”距离矩阵来减少各分支速率的影响，因而系统树的正确与否依赖于校正距离系数的准确性．当序列较短时，计算仍可能有较大的统计误差．NJ法由于仅限于数据矩阵的统计值，相对于后述的具体位点的分析方法，其最大优势是运算十分简便而快捷．但是该法的不足之处是，由于不考虑各个位点的具体情况而丢失了一些有用的遗传信息，另外，通过这一方法得出的枝长估算值不具有确定的进化意义．

最大简约法

该方法源于形态学的分支系统学研究，而最早被Fitch(1971)用于核苷酸数据研究．它是一种最优化标准，遵循“奥卡姆剃刀(Ockharn’S razor)原理，即假设由一祖先位点替换为另一位点时，发生的替换数目最少的事件为最可能发生的事件．在实际应用中，由于MP法只考虑所谓的“信息位点”，所得的进化树是最短的、也是变化最少的进化树．因而，简约法的“最小核苷酸替换数目”原则也意味着“异源同型事件(homoplastic event)(即平行替换、趋同替换、同时替换和回复突变等)最少．

就序列上的位点来说，它没有明确的假设，无须估计核苷酸替换时所用的各种数学模型，且当序列问的分化程度较小、序列长度较大且核苷酸替换率较稳定的情况下，该法能获得更为真实的拓扑结构．反之，当序列较短且序列间的进化速率差异较大或替换形式不同时，异源同型事件出现的概率就大，产生所谓的“长枝吸引”或“短枝吸引”效应，而得出错误的拓扑结构．另外，由于MP法需要比较大量的拓扑结构，当序列数目和长度较大时，运算过程非常耗时．

最大似然法

该法最早由Felsenstein(1981)提出，其原理是以一个特定的替代模型分析一组既定的

序列数据，使获得的每一个拓扑结构的似然率均为最大，再挑出似然率值最大的拓扑结构作为最终树．但由于该法涉及到全部序列的所有核苷酸位点的替换数，加之假设的替换模型包含一组可变参数(如转换/颠换比等)．所以该法和MP法一样，当序列数目和长度较大时，构建NIL树是极其耗时的，同时当序列数目足够大而序列长度很小时，和MP法一样，它也容易给出错误的拓扑结构．

分子系统学

1、本站所有文本、信息、视频文件等，仅代表本站观点或作者本人观点，请网友谨慎参考使用。
2、本站信息均为作者提供和网友推荐收集整理而来，仅供学习和研究使用。
3、对任何由于使用本站内容而引起的诉讼、纠纷，本站不承担任何责任。
4、如有侵犯你版权的，请来信（邮箱:baike52199@gmail.com）指出，核实后，本站将立即删除。

下一篇超基因家族

上一篇钙离子