分子系统学中统计推断问题的极限行为研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:awaydedao132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术的不断发展和基因组数据的积累,分子系统学取得飞速发展,这对分析群体演化历史和推断不同物种间的进化关系有着重要的意义.在过去几十年里,多物种溯祖模型已成为对多物种基因组数据进行统计推断的重要模型.本文主要基于多物种溯祖模型研究分子基因组学和群体基因组学中的统计推断问题,包括进化参数的估计、模型选择问题的理论研究及其在系统发生树中的应用,得到系统发生树支持率的极限分布和后验概率的极限行为.系统发生树的重建问题可看作统计学中的模型选择问题,且被选择的系统发生树的可靠性常用后验概率或Bootstrap支持率进行刻画.然而,使用贝叶斯方法重建系统发生树时,生物学家发现了星状树悖论:当真实的系统发生树是星状树,即备择模型的错误程度相同时,随着数据量趋于无穷,被选择的系统发生树的后验概率总是接近100%,但不同的独立样本又很可能支持不相同的系统发生树,导致推断结果不具有一致性.本文首次使用Bootstrap方法对错误程度相同的模型开展研究.在备择模型错误程度相同的情况下,使用最大似然方法进行模型选择时,我们首次发现模型的Bootstrap支持率收敛到非退化分布,并得到系统发生树Bootstrap支持率的极限分布,且完成相应的统计实验和星状树的仿真实验.在进化树推断中,对同一物种的不同基因组进行分析时,生物学家常常观测到被选择的系统发生树不同且其支持率往往都不低,我们的分析解释了引起这一现象的原因.此外,本文还发现Bootstrap支持率的极限分布没有后验概率的极限分布那么极端,解释了模型的Bootstrap支持率往往比后验概率保守.其次,本文使用m out of n Bootstrap方法继续深入研究错误程度相同的备择模型,获得模型m out of n Bootstrap支持率收敛到单点分布的充分条件:m=O(nγ),0<γ<1.在该条件下,对不同的独立同分布数据集进行分析时,随着数据量趋于无穷,m out of n Bootstrap支持率的极限分布是单点分布.特别地,该单点分布的值往往是Bootstrap支持率极限分布的期望.此外,本文也得到该方法下系统发生树的支持率收敛到单点分布.所获结果可以为解决星状树悖论与理解错误程度相同模型的本质提供帮助,兼具理论与应用价值.最后,在多物种溯祖模型下,本文使用计算机仿真研究基因组数据中各因素对贝叶斯推断结果收敛速率的影响.当备择模型错误程度不同时,贝叶斯方法可以选择相对正确的系统发生树.此时,数据中的各种因素如何影响推断结果便成为研究者们重点关注的问题.本文主要研究在多物种溯祖模型下基因组数据中的序列数量、序列长度以及基因座数量对统计推断结果收敛速率的影响,得到不同推断问题中各因素的重要性排序,其中推断问题包括物种分化时间、种群大小和基因渗入强度等进化参数估计问题与物种树选择问题.仿真实验表明,在大多数情况下,基因座数量对推断结果的影响最大.特别地,在估计分化时间和种群大小时,若数据量足够大,那么后验期望估计的均方误差与基因座的数量约成反比;序列数量对物种树的估计并不重要,但对物种定界的影响很大;增加序列长度与增加突变率对参数估计问题的影响相当,但在物种树估计问题中,序列长度对推断结果的影响比突变率大.以上发现有助于学者在收集基因组数据时,合理地选择抽样方案和测序策略.
其他文献
近年来,我国高速铁路发展迅速,逐渐形成了以“四纵四横”为基础,“八纵八横”为目标的高速铁路路网。根据我国2016年编制的《中长期铁路网规划》,预计到2025年,高速铁路路网规模将达到3.8万公里左右。面对如此规模的高速铁路路网,高速铁路列车的运行组织在战略层,战术层和运营层都面临着前所未有的挑战。我国高速铁路运营情况复杂,不同速度等级的跨线列车与本线列车混合运行,但现有研究大都忽略了跨线列车对能力
随着城市城镇化进程的推进及汽车保有量的增加,城市交通资源短缺和交通拥堵现象日益突出。同时,城市居民交通出行也逐渐向方便、快捷、经济转变,交通服务企业的出行供应面临巨大的挑战;然而,交通服务企业在自身资源约束下的出行供应也会影响居民交通出行选择。交通出行是一个包含居民出行、交通服务企业和交通管理者的多参与主体的复杂关系。为实现资源合理分配和有效利用,缓解城市交通拥堵,交通管理者不能单靠投资交通基础设
在日常生活中,排队现象非常常见,例如在超市收银台前排队结账、拨打电话等待接通、医院排队挂号、检测、治疗等等.排队论,旨在结合随机模型和概率理论研究一系列排队系统中重要性能指标,例如等待时间、队列长度、延迟的概率等等,因此又称为随机服务系统.这些指标可以帮助系统管理者做出更优的运营决策.除了到达过程和服务时间的随机性外,另一个可能影响系统性能的重要因素来自排队主体—顾客的策略行为.考虑顾客行为的排队
近年来,以硅基光电子技术为代表的片上集成技术越来越受到学术和产业界的关注。尽管硅与包层材料之间的高折射率差显著减小了器件尺寸,但偏振态对硅基光电子器件和回路的性能产生了非常显著的影响。目前,大多数的硅基片上偏振调控器件都是介质波导结构。由于介质材料的双折射效应较弱,器件尺寸往往较大,且结构相对复杂。表面等离激元是一种存在于介质和金属界面的特殊表面波,可以将光场能量很好地限制在界面附近,具有亚波长尺
随着国民经济的快速发展,以及铁路相关技术的不断进步,为了满足人们日益增长的生产和生活需要,“货运重载化”成为我国货运铁路技术的重要发展方向。为解决两万吨级重载列车的通信业务需求,朔黄铁路公司世界上首次将LTE-R(Long Term Evaluation-Railways)技术应用于重载铁路。LTE-R无线通信网络承载着重载列车的核心通信业务,因此LTE-R网络的可靠性和稳定性,直接影响着朔黄铁路
冷轧301LN奥氏体不锈钢制造的轻量化不锈钢轨道客车以其安全、节能和材料可完全回收等优点,广泛地应用在地铁和城际快速列车中。在不锈钢车体侧墙的连接中通常采用低热量输入的电阻点焊,但是该方法会在车体外表面留下大量的可见压痕,严重影响了车体的外观质量和耐腐蚀性。非熔透激光焊接是替代电阻点焊解决上述问题的理想方法。因此,本文以301LN不锈钢车体侧墙与连接件的搭接非熔透激光焊接接头为研究对象,开展了服役
国家富强之要在于社会进步,社会进步之源在于治理完善,治理完善之本在于人的发展。党的十八届三中全会提出推进国家治理体系和治理能力现代化,党的十九届四中全会强调要坚持和完善共建共治共享的社会治理制度。这一全面深化改革总目标的达成,归根到底是促进人的发展。无论是解决社会主要矛盾中人的社会关系冲突的外在表现,还是借鉴当代的西方社会的治理经验,以期在实践中进行矫正和达到动态平衡,实现“源头治理”,都必须首要
内部网络在网络空间中普遍存在,与互联网物理隔离或逻辑隔离,已经融入到人类社会治理和社会活动的各个领域,承载有高价值私有数据,属于信息“富矿”类网络。虽然,这些网络受到法律和制度保护,但遭受攻击的情况层出不穷,而且是内部攻击和APT攻击的重点目标,如何及时发现内部网络中存在的漏洞和隐患,如何准确识别网络中的攻击事件,如何有效判断网络中的异常行为,进而提升网络的主动防御能力,已成为当前网络安全亟待解决
自复位耗能支撑(Self-centering energy dissipation brace,简称SCB)是在普通钢支撑和屈曲约束支撑(Buckling restrained brace,简称BRB)的基础上发展而来,能够为结构提供抗侧力,消耗地震输入能量并将残余变形尽可能减小甚至消除,在确保结构安全性的同时降低震后修复时间与成本。本文针对现有SCB及其结构体系研究中存在的不足,研发两种新型自复
新时代高等教育改革创新的趋势不断深化,我国高等教育迎来了爆发式发展,在此背景下,研究高等院校内部控制相关理论与应用,提出高等院校内部控制多层面决策方法对于提高高等院校内部控制、优化高等院校办学资源具有重要的理论意义和实践意义。我国高等院校经历了自由发展、加速发展和转型发展三个阶段,各大高校内部控制体系建设取得显著成效,但也存在着明显差异,面临着高层认识不统一、管理流程不严谨、风险防范机制不健全、监