当前位置：首页 > 教育 > 正文

陪你学·生信十一、构建系统发育树

启示号
教育
3天前
89

- in Makes Sense-

in the Light of

—— (1973)

这个推送主要是系统发育树相关内容（内容很多，但这篇文章并不包含多基因级联建树，挖个坑下次写。我将一些tips和操作示例写在了可以划动的模块里，让整篇推送看起来结构清晰，如果不想看可以跳过划动部分）。上一个推送的多序列比对（[陪你学·生信]十、编辑对多序列比对结果[陪你学·生信]九、多序列比对- （MSA））是系统发育分析的基础。

文章有点长，先放个流程图便于理清思路。

陪你学·生信十一、构建系统发育树

一、系统发育树能分析什么

系统发育分析是根据生物核苷酸/蛋白序列的相似程度（进行MSA）将其归结成分支和簇，从而推测一组基因或蛋白质或生物间的进化关系。当然，系统发育分析的前提是进化论。

实验中系统发育分析常见目的有：物种鉴定，基因功能鉴定，追溯基因起源等。

二、准备序列数据时需要考虑的问题

1. 建什么树？用什么序列？

（1）核苷酸序列nt还是氨基酸序列aa

系统发育分析所选的序列应包含足够的信息，全基因组序列包含信息多，但是全基因组序列的分析麻烦、耗时长；且有的时候研究对象就是某一个基因或者蛋白。所以多数情况下，我们使用基因或蛋白序列建树。

可以的话，选择的这个基因在基因组的拷贝数最好为1，这样避免了旁系同源基因建树的影响。有的生物基因组小，比如病毒，建立物种树有时可以用全基因组序列（nt）进行系统发育分析（如果是蛋白序列同源性分析当然是aa序列，如果是非编码区序列分析当然是nt序列）。

对于可以用aa或者nt序列分析的实验材料，没有标准的答案。如果DNA序列之间的一致度高于70%或进化距离很近用nt序列更合适，因为nt序列的比对已经很整齐了，还可以保留同义突变；如果亲缘关系较远，用aa更合适，MSA时可以使保守区域对齐。也可以两个都试一试，可以加入已知物种/进化关系的同源分子做对照，看哪个结果更符合已知事实。

之前看过一篇论文，说目前发表的文章中构建的系统发育树多数都重复不出来。建树很“主观”，受到序列的选择、MSA、比对后剪辑、建树算法和参数等影响。所以在实验得到一个相对准确和满意的发育树后，最好记录下操作过程和参数。

（2）做的是基因树 (gene tree) 还是物种树 ( tree)

同源基因是指由共同祖先基因衍生的基因，主要有三种关系：直系同源、旁系同源、异源同源。

如果在建树时选择了一个生物中的旁系同源基因，或者选择的是不同物种中的同源基因，即直系同源，那么构建的都属于基因树。

我们视生殖隔离的产生为物种分化的标志，所以基因分化时间和物种分化时间不一致。基因树和物种树主要存在的差异有：①两物种的两个基因分化发生在物种形成事件之前，导致对系统发育树中最长分支的分析过估计；②基因树的拓扑结构可能和物种树存在差异。

基于上述原因，只能通过基因树来推测物种树。研究人员构建物种树时往往利用多个基因或蛋白级联建树。

小tips：两个同源序列是直系还是旁系？

直系同源（）不同物种中，来自物种分化。功能相似。

旁系同源（）同一物种中，由于基因复制、累积变异产生。功能不同。

异源同源（）不同物种中，基因的横向转移，比如溶菌酶基因GH25。功能相同。

硬要较个真儿的话，其实我们说不准，不同物种中的两个同源序列是直系还是旁系，比如A1和B2就是旁系同源。

陪你学·生信十一、构建系统发育树

理论上，想要区分它们是很难的，只有通过一些判断，推测它们是哪一种。不能保证100%正确，但是起码我们把它们看作直系同源来建树也不会错得离谱。

推测方法：当我们有两个物种C和D的全基因组序列数据、蛋白质组大小相似的情况下，如果将C中序列C1与D中D1, D2, D3......Dn进行BLAST，返回结果的top1是D1；再反过来将D1与C1, C2, C3......Cn进行BLAST，返回结果top1是C1时，可以推测C1和D1应该是直系同源基因。

用类似且更复杂的推测方法建立了一个直系同源序列的集合——COG（ of ）。

（3）残基替换饱和度检验（Test of ）

生物在进化发育中，nt/aa序列的残基会发生替换，通过对nt/aa残基替代数计算获得进化距离，而系统发育树是在进化距离基础上构建的。所以有必要对即将构建进化树的序列进行替换饱和度检验。

替换饱和度指的是一条序列同一位点残基发生多次替换（替换了几次又变成一样的残基了），或不同序列发生相同的替换。这会导致原本应有很大差异的两个序列，计算后却进化距离很近，从而导致长枝吸引现象（long ，LBA）。

如果序列替换趋向于饱和，那么包含的系统发育信息少，用这些序列建树的意义不大。很多时候我们直接建的树感觉没啥大问题，常忽略饱和度检验。

操作：残基替换饱和度检验

可以使用DAMBE软件进行分析（下载链接）：

首先导入比对后的序列，进行seq.-> -> test by xia et al的分析。

陪你学·生信十一、构建系统发育树

当Iss

（4）其他建树序列选择的tips

避免使用不完整的序列片段开始多序列比对；

避免使用异源同源序列；

避免使用重组序列。

小tips：常见的问题和可能原因

NCBI-BLAST中相似度最高的两个序列，建树的距离特别远？或者相似度很高的一组序列，系统发育树（步长值）很低？

可能是：

（1）比对时，下载的序列A的第一个残基比对的序列B的最后一个残基，比对时序列方向需要手动调整。

（2）MSA质量太高，所有序列的相似度都很高，就很可能出现步长值低这样的情况。可以这样理解，因为序列间没有足够大的差异，所以没有计算出显著的建树结果。可以引入一些差异较大的序列、外群或换一种建树方法（ → ；除了MEGA-X，还可以试试PhyML 3.0等网页）。

PhyML 3.0：

（3）MSA质量太低，检查所选的序列，或者从算法上可以考虑MP法进行建树。

2. 多序列比对结果编辑

多序列比对结果的质量是影响建树质量的关键因素。应使其尽量：

（1）没有大量gap

（2）剪辑MSA不齐的两端

（3）保守区域选择：即优化MSA质量，保证比对结果中含有信息量大的板块，使比对质量高，但是残基一致性低。适用于信息位点足够多的长序列。

根据以上原则（1）（2），图片中短序列MSA结果中三个框的部分就可以删除。

陪你学·生信十一、构建系统发育树

操作：使用选择保守区

线上工具:

陪你学·生信十一、构建系统发育树

还有本地版可以下载

有适合MAC，和Linux的不同版本。

一般这个操作都是针对长序列，但是为了节约时间，下面我用短的多序列比对结果举例。

陪你学·生信十一、构建系统发育树

下载之后界面如下图，首先输入b然后回车，即设置Block →这里的5，即“ Gap ”有“None/Half/All”不同选择，默认是None，如果要更改就输入5再回车。根据分析要求选择不同的程度，我这里选了None→输入m回车，即打开主功能页面→输入o回车，即打开文件口令→然后输入文件地址加扩展名如下图→打开文件后，软件默认是蛋白质序列，如果不是可以输入t重选，我这里举例序列是蛋白质，就按照默认值，输入g回车获得保守区。

陪你学·生信十一、构建系统发育树

这时软件文件夹中会生成两个文件，一个是.fasta-gb文件（默认扩展名，可修改为fasta进行后续分析），另一个是网页文件，打开后标蓝色区域为保守区。

陪你学·生信十一、构建系统发育树

三、构建系统发育树

1. 不同建树方法

建树原理主要分为基于距离的方法，即输入距离矩阵即可的距离法；以及基于序列信息的方法，即简约法、似然法等。常见的方法简单介绍如下（更详细的原理有空再写，挖个坑）：

（1）邻接法（-，NJ）：基于最小进化原理，通过比较每对序列的距离，构建一个总距离最小的拓扑树。速度最快，结果较为准确，比较常用；更适用于进化距离不大（0

你可能想看：

构建系统的核心要素

我们大学生到底该从何做起、或者说有什么核心要素？我们说运气这事符合正态分布规律，符合趋势、踏踏实实努力、少犯错误，政治因素、经商环境、法律条文都存在隐在暗处却可能致命的风险。比如很多人都说东南亚沿线国...

2016发育性髋关节发育不良临床诊疗指南(0-2岁)(精简)

确定了0-2岁发育性髋关节发育不良诊治的争议问题共22项，并对体检异常或存在高危因素者行超声检查：可以初步筛查出脱位并可复位(Ortolani阳性)和怀疑脱位不可复位(外展受限、Ortolani阴性)...

学生信息道德培养活动设计方案

为此我校开展信息道德教育活动，广泛宣传国家互联网管理使用及网络安全等法律法规，引导学生运用信息知识解决信息问题，自觉抵制网络不良信息。信息能力是指运用信息知识，技术和工具解决信息问题的能力，它包括信息...

如何构建写作系统，以让自己系统练习写作？

如果你想让自己在写作方面有更多的收获。我们平时说的一篇文章所包含的内容有标题、开头、正文、结尾、修辞方式、素材等等，所谓的写作系统就是由标题、开头、结尾、故事等各个部分组成的整体——这样概括也是为了让...

【原】如何构建写作系统，以让自己系统练习写作？

如果你想让自己在写作方面有更多的收获，就需要构建自己的「写作系统」。我们平时说的一篇文章所包含的内容有标题、开头、正文、结尾、修辞方式、素材等等，所谓的写作系统就是由标题、开头、结尾、故事等各个部分组...

构建认知系统，以系统对抗世界

逻辑清晰的分析作为行动的指导，复杂系统的涌现现象是从原理级别来解释系统超越散点的逻辑涌现是指系统从低层次到高层次的发展过程中，真正厉害的人都是系统认知的“你需要将知识看作成一颗「语义树」——首先，应确...

电脑系统怎么重装win11？U盘重装系统之微PE安装win11系统教程

需要在主板BIOS中开启TPM2.0、开启安全启动，使用UEFI启动方式+GPT格式硬盘等，并且在传统Legacy启动方式+MBR格式硬盘下也可以成功安装Win11，下面装机之家分享一下U盘重装系统之...

人类大脑双系统理论：系统1和系统2

系统1接近我们说的感性思维；系统2接近我们说的理性思维。要能时刻调用系统2，而让用户只用系统1就行了，不能动不动就调用系统2，不要仅仅只跟着感觉走。（爬行脑）还会引发一种禀赋效应。为什么非连续性是人类...

大健康三大落地系统：核心系统、模式系统、...

打造大健康商业闭环！销售-信息反馈-研发产品······：诱饵----粉丝---种子用户-社群----口碑传播/分销-裂变——新诱饵、新粉丝······：病毒式传播（口碑）-新增量······，商业闭...

秋天的路，我想陪你一起走过

轻轻地踩着一地的温暖，全是秋天的味道，一边懒散地饱尝林间小路上弥漫着的秋天的味道。一边任由秋天的色彩在自己的心里眼里斑斓，树林里光线质感明显，小路上投下树的凌乱的影子，可以交错成回忆里温暖的诗句。林中...

人到七十才顿悟，陪你走到“人生终点”的，只有这4类人

你会明白人心的险恶，你会知道谁是你的好朋友，挚友和亲人太少了，又何况是那些毫无感情的陌生人呢，年轻的时候我们都喜欢广交朋友，认为这些人会陪伴我们走下去，才会陪伴我们到老，也明白何为人生的卑微，杨大伯经...

我的人生信念

要是凭信念就会万无一失了！现如今不能凭空想象和不切实际的行动，更不能放置信念而不顾，你不是没有想的能力，你也不是没有做的能力，尤其在现实中很容易的事你都做不到和办不好，在该动用理论和信念去实践的时候也...

今晚陪你而坐

和我一起享受着夏夜的风，眯着眼似睡欲醒，但我却感到夜的宁静和柔和，其实我就是想看看你读书的样子，你的两只眼睛一定盯着某些文字试图找寻一些什么，书馆真的应该设置一个信箱配上来电显示。喜欢闻着你这里幽幽香...

2，如何让你和陌生人产生信任？

你可能会有疑问号码真的有吉凶吗，这就是为什么在现实生活中无意中换了个号码原本平静的生活。大部分情况下都是根据自己对数字的喜好和感觉来进行选择的。但是并不知道不同的数字组合排列起来的手机号码会产生吉凶祸...

从读书到构建自己的阅读系统

首先我还是想谈下阅读和读书这两个概念，读书的读更加强调了阅读过程的系统性，最终读完后都希望对书籍有一个系统性的认知。仍然最喜欢阅读纸质书籍，在前面几年自己的阅读重点往往都是人文艺术和历史方面的书籍，同...

手把手教学系统进化树构建

二、为什么要构建系统进化树。从进化树拓扑结构和枝长中推测背后的进化机制。三、构建系统进化树常用的方法，（通常用两种以上方法构建系统树）：五、构建系统进化树的流程，六、构建系统进化树的常用软件“集成的进...

如何构建一个完整的交易系统

没有给交易者留下任何主观思考的余地。首先需要作出的决策就是买什么品种，在其中某个品种存在趋势的可能性才会比较大。但是一般新手交易者往往会忽视，新手往往大多在单笔交易上投入过大，这往往是新手交易者最关心...

哈佛研究新生儿体重靠近6.5斤大脑发育好聪明

孕妇体内的婴儿也就能吸收更多的营养，新生儿的体重越接近6.5斤，大脑的发育情况会越好，新生儿的智商和体重有直接影响。新生儿体重过多、过大的情况下，新生儿的头脑发育更不完善，新生儿体重越大。稍有不慎不光...

【促卵泡发育、增厚子宫内膜】今天给大家推...

今天给大家推荐一款促进卵泡发育、增厚子宫内膜的备孕调理汤方。患者朋友们好评不断的好孕汤，对于卵泡发育，增厚子宫内膜有一定的调理作用。[太阳]好孕汤，乌鸡，生姜。乌鸡焯水后把所有材料放进炖盅隔水炖2 个...

[神经影像] “小脑发育不良性神经节细胞瘤”的临床表现、MRI特点及鉴别诊断

小脑发育不良性神经节细胞瘤（dysplasticgangliocytoma of the cerebellum)，后颅窝占位表现；以及脑神经麻痹等为常见临床症状，属小脑少见良性病变。病变部位与正常小脑...

奇经八脉阴阳定性发育发生机理

胚体背—腹轴性的形成是经脉阴阳定型的第一原则，从背侧面分化发育形成的经脉主要是外胚层为主发育而成的，胚胎腹侧面形成的经脉主要是内胚层为主导分化发育而成的。背部脊髓腔中轴线位置凹槽对接线附近形成的经脉称...

国内第一部系统研究大学生犯罪问题的我院李其平副教授著作的专著出版发行

国内第一部系统研究大学生犯罪问题的我院李其平副教授著作的专著出版发行我院党委副书记李其平副教授所著《当代大学生犯罪原因及预防对策研究》一书，大学生犯罪现象引起了全社会的广泛关注，就是要对大学生犯...

Win10系统如何把我的文档转移？ | Win10系统之家

可以把我的文档转移到其他地方，一来能释放安装后所剩不多的空间，二来避免重装系统导致资料丢失。Win10系统如何把我的文档转移？在这台电脑中我们就可以看到我的文档，　　2、右键点击你想转移的，选择属性；...

复杂系统获诺奖，物理学将迎来质的发现，初始系统可能是万有理论

今年的诺贝尔物理学奖给了研究复杂系统的三位科学家，不得已今年的物理学奖其实有半个气象学奖在里面。大家想了解复杂系统可以去网上搜一搜，今天我要讲的是和复杂系统类似的东西，一个初始系统的概念在我脑海萌生，...

用U盘给电脑装系统必须要“制作”U启动，学装系统前必学U启动

现在讲解使用U盘给电脑装系统的相关知识点。原本电脑是从电脑中的硬盘硬件启动，那可以选择让电脑从制作好的U盘设备中启动，U启动界面U盘启动的制作工具的类型。

win7 oem 激活方法|教你怎么oem激活win7系统－系统城

如何通过oem激活win7系统？win7 oem激活就是使用oem密钥永久激活win7系统，大部分的win7激活工具都是采用oem激活方式，自动安装oem密钥，实现永久激活win7系统，都可以oem激...

5个方面，让你学会演讲的核心法则

对双方的沟通价值オ是最大化的呢,答案是让他记住你的名字,如果对这一分钟的演讲结果做细致的划分:为了提高结尾的效果,正确的做法是强调两个关键词回放经典:就是提出一个高价值的愿景,造一个让听众坚信可...

系统发育树进化关系核苷酸蛋白序列全基因组序列

上一篇
“土法炼钢”的精神基因

下一篇
太瘦的女人不怀孕有什么妙方？

陪你学·生信十一、构建系统发育树

最新文章

彩库宝典下载最新版本下载

彩库宝典下载最新版安卓

2023年立春之日去南京老门东看灯（4）

【占星入门】看懂星盘的符号 | 读出星盘

彩库宝典下载最新版

彩库宝典正式版下载安装

原来姜昆不仅会说相声，当年还演过电影，风趣幽默充满正能量

心慌、心悸治疗方

热门文章

欣赏丨世界著名的60幅女人体油画，裸露但不低俗~

小六壬完整解释

小六壬神断口诀大全，掐指一算直断生死！

荨麻疹图片和症状：手脸脖子荨麻疹初期症状图片大全

亲戚关系图（关于中国亲戚称谓）家庭称谓大全，再也不用担心叫错了称呼

珍贵舌诊：脾肾阳虚、虚寒泄泻、胃阴虚的舌苔照，看完记得存！

倪海厦经典配方全集（六）——桂枝汤、大小青龙汤、五苓散等

“四川泸州油纸伞” 的第七代传承人余万伦古法制伞一辈子