基于特征层次的多目标系统发育树构建方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:wanghongtao11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
系统发育分析是计算生物领域的一个重要分支,其主要目的是重建物种之间的进化历史和亲缘关系,了解何时以及可能发生的物种形成事件,研究物种的演变过程。本文首先针对形态数据中的缺失数据造成系统发育树构建不稳定的问题,结合形态特征描述和先验知识,生成对应的特征层次关系,并结合特征依赖关系对缺失值进行估计,从而得到完整的形态数据集;然后,采用不可适用Fitch算法用来区分和度量适用数据和不可适用数据之间的状态转换;最后,进行基于最大简约原则和最大似然原则的多目标系统发育树构建,生成同时满足多目标的Pareto最优系统发育树集合,避免了单一原则下建树的局限性。相较于现有的系统发育分析方法,能够较好地解决缺失数据、不可适用数据造成的树结构不确定的问题,并通过多种建树原则,为生物学家研究生物进化提供更多依据。本文的主要工作如下:1)根据形态特征之间存在逻辑关联的特点,构建并形式化特征层次关系。结合特征层次关系信息提出了一种基于特征层次关系的形态数据缺失值估计算法。实验结果表明,在插补准确率和拓扑差异率评估中,基于特征层次关系的缺失值估计算法优于常见的缺失数据处理方法。插补后的数据集进行系统发育树构建能够得到与标准树更相似的系统发育树,较好的解决了缺失数据影响下的系统发育树准确性的问题。2)针对不可适用数据的处理,相较于常见的处理不可适用方法,如将不可适用数据看作缺失数据或者额外的特征状态来说,不可适用Fitch算法能够更好的区分和度量适用数据和不可适用数据之间的状态转换,并将其加入到多目标系统发育树构建中,较好的解决不可适用数据带来的问题。3)为了避免同一数据集在多种建树原则下可能出现冲突的情况,本文将最大简约原则和最大似然原则相结合,提出了一种多目标系统发育树构建算法,从而得到同时满足多个系统发育树构建原则的系统发育树集合。实验表明,本文提出的方法构建的500棵树结构中65.4%与现有软件生成的系统发育树保持一致。在拓扑准确率方面,本文提出的方法拓扑相似度为82.2%高于最大简约法、最大似然法、贝叶斯推断法、邻接法。当形态数据存在缺失时,采用本文提出的方法“先插补后建树”可以得到83.26%的平均拓扑相似度。因此,相较于现有方法来说,本文提出的方法具有很好的应用前景。
其他文献
随着移动设备的爆炸式增长以及新型网络技术的出现,传统网络规模日渐庞大,运营商收入却逐渐减少。为此运营商迫切希望在满足用户多样化需求时,可降低网络复杂程度,提升业务部署效率。网络功能虚拟化(Network Function Virtualization)技术的出现为该问题的解决带来契机,它通过在服务器和交换机等通用硬件上运行特定软件来实现传统的网络功能,以更低的成本构建具有更好可伸缩性、灵活性和适应
蛋白酶(protease)是生物体内通过切断肽键从而水解蛋白质的一类酶的总称,控制着蛋白质的大小、组成、空间构象及其最终降解。生物体内的生理活动和疾病的发生与蛋白酶息息相关。沙雷氏蛋白酶属于锌金属蛋白酶M10B亚家族,其中某些种类是一些疾病的关键致病因子。专一性沙雷氏蛋白酶抑制剂在体外可靶向抑制沙雷氏蛋白酶。通过沙雷氏蛋白酶抑制剂抑制沙雷氏蛋白酶,从而减弱产沙雷氏蛋白酶的细菌病原体的活性,成为疾病
网络技术是物联网、云计算、边缘计算、5G网络等新兴技术的核心和基础,传统网络功能基于专用硬件部署导致网络资源分配不灵活,不能够满足目前海量差异化的应用需求。基于网络功能虚拟化(NFV,Network Function Virtualization)的网络功能部署方式是实现网络资源灵活分配的有效方法。服务功能链(SFC,Service Function Chain)和混合型SFC将多个虚拟化网络功能
数据所拥有的独特价值,使其既是一种资源也是一种权利。以数据的形式存在的个人信息是个人权利的重要内容,不容随意侵犯。电子数据既承载个人信息又揭示犯罪事实,在犯罪侦查
在投影条纹法的应用中,往往需要大量的后处理工作。因为相机视场不可能恰好等于待测物的面积,在测量过程中也伴随着对不必要信息的测量,增加了需要处理的数据量和噪声来源,故
随着我国城市化进程的加快,城市生活垃圾已经成为了一个重要的环境问题。根据《生活垃圾分类制度实施方案》、《关于在全国地级及以上城市全面开展生活垃圾分类工作的通知》,
近年来,随着互联网的普及,线上产生的数据呈爆炸式增长。在此背景下,推荐系统因其对信息的主动筛选能力,成为解决“信息过载”问题的一种有效手段,被广泛应用于各大领域。但
中继选择是协作通信系统的关键技术,中继选择的优劣对于协作通信系统的性能起到了决定作用。收集能量的有效利用则对于能量收集协作通信系统至关重要。因此,在中继选择中如何
党的十八大首次提出教育的根本任务是立德树人,发展素质教育,重视学生掌握知识的同时,越来越重视对学生认知结构与学习能力的培养,追求学生的必备品格和关键能力。开放式教学
深海是一个黑暗、低温、高压和营养贫瘠的生态环境。深海微生物为了适应这样极端的环境,微生物中分离得到的海洋微生物酶因此具有低温催化高效、耐盐、pH耐受范围广等特殊的酶学性质,因此具有很大的应用潜力。本研究从马里亚纳海沟深海微生物Alteromonas sp.ML117中克隆出产β-半乳糖苷酶的基因Bgal,通过构建表达载体转化至大肠杆菌中进行外源表达。并对其进行纯化和酶学性质的研究,通过单因素和响应