论文部分内容阅读
世界上现存鸟类的数量约为1万种,分属于40目、247科和2312属。鸟类作为脊椎动物的一大类群,广泛分布于世界各地,具有丰富的物种多样性和基因多样性。鸟类与人类的生存和发展息息相关,并在维护生态平衡中起到重要的作用。雀形目(Passeriformes)是鸟纲中最大的目(约占总数60.4%),大多数雀形目鸟类在早第三纪(Paleogene)经历了快速进化,关于雀形目的起源及各科间的系统发育关系错综复杂,是鸟类学研究中争论的热点。由于线粒体的起源与进化贯穿整个真核生物的起源与进化过程,线粒体DNA具有严格的母性遗传、较快的进化速率等特点,是系统进化研究良好的分子标记。本研究通过第一代测序技术扩增并测定8种雀形目鸟类线粒体基因组,并利用新一代高通量测序技术对5个红嘴蓝鹊(Urocissa erythroryncha)个体进行cDNA文库的构建及转录组测序。此外,本研究还通过高通量测序技术对6种雀形目鸟类和1种鹦形目鸟类进行基因组文库的构建及序列的测定,并结合本课题组已测定的其他鸟类转录组数据,以及NCBI公共数据库中的相关数据,我们探讨了如下4个问题:(1)雀形目线粒体基因组结构特征;(2)雀形目核线粒体假基因(NUMT,Nuclear Mitochondrial pseudogene)的探测、验证及分析;(3)雀形目鸟类线粒体系统发育基因组学的研究;(4)线粒体基因组重排类型及控制区系统发育意义研究。主要研究结果如下:1.雀形目线粒体基因组结构特征为了探讨雀形目线粒体基因组结构特征,本研究通过PCR技术和一代测序技术对银喉长尾山雀(Aegithalos glaucogularis)等8种雀形目鸟类线粒体全基因组进行扩增和测序。通过序列的校正、组装与分析,8种鸟类的线粒体基因组均为环状结构,包含13个蛋白编码基因、22个tRNA基因、2个rRNA基因。线粒体基因组全长为16,765~17,936 bp。除银喉长尾山雀、灰眶雀鹛(Alcippe morrisonia)和蒙古百灵(Melanocorypha mongolica)包含2个线粒体控制区外,其余鸟类均只有1个线粒体控制区,根据Gibb的命名方法,银喉长尾山雀和灰眶雀鹛属于d_CR基因组重排类型,蒙古百灵属于r_CR2基因组重排类型,其余鸟类属于“Ancestral avain”基因组重排类型。并根据控制区序列相似度和系统发育学证据,将仙八色鸫(pitta nympha)线粒体基因组划分为r_CR2型。2.cDNA文库的构建、转录组测序与分析为了探讨NUMT是否具有转录活性,以及线粒体基因组的异质性,本研究选取红嘴蓝鹊为代表,对其5个个体进行cDNA文库的构建和转录组测序。以样品凭证编号为K0739个体的转录组为例,使用Trinity软件进行数据组装,共包含234,805条转录本,GC含量为47.89%,N50为3,343 bp。本研究利用生物信息学方法,从5个红嘴蓝鹊个体的转录组测序结果中获取对应个体的线粒体全基因组,并分析其异质性。结果表明,5个样本的线粒体全基因组异质性均低于1%(Var=0.45%),这些异质性位点不影响鸟类系统发育分析。3.基因组文库的构建及基因组测定为了探讨雀形目线粒体系统发育基因组学,以及从基因组水平验证转录组中提取的NUMT,本研究选取红嘴蓝鹊、画眉(Garrulax canorus)、树麻雀(Passer montanus)、红嘴相思鸟(Leiothrix lutea)、灰椋鸟(Spodiopsar cineraceus)和丝光椋鸟(Spodiopsar sericeus)和费氏牡丹鹦鹉(Agapornis fischeri)为研究对象进行基因组文库的构建及基因组测序。其中费氏牡丹鹦鹉(A.fischeri)为系统发育研究的外类群。并以丝光椋鸟基因组为例,使用SOAP denove2软件组装后的基因组共包含1,129,900条Scaffold,GC含量为41.96%,N50为2,035 bp。4.雀形目NUMT的探测、验证及分析本研究通过BLASTn工具对红嘴蓝鹊、画眉、树麻雀、红嘴相思鸟、灰椋鸟转录组中的NUMT进行研究,并通过基因组测序对探测到的NUMT进行验证,共发现25个具有转录活性的NUMT。通过随机性的PCR扩增和测序,表明组学方法探测到的NUMT可以通过一代测序在基因组上得以验证;RT-PCR及测序结果为NUMT具有转录活性提供了强有力的证据;通过染色体定位分析,本研究认为雀形目鸟类NUMT主要分布在基因密度较低的染色体上;通过对NUMT两翼序列进行分析,本研究认为雀形目鸟类NUMT两翼序列AT含量较高并含有大量插入序列。本研究首次同时从转录组水平和基因组水平展开对雀形目鸟类NUMT的研究。5.雀形目线粒体系统发育基因组学本研究通过PCR和一代测序技术扩增和测定了8种雀形目鸟类线粒体全基因组,以及利用二代测序和生物信息学方法从组学数据中获得6种雀形目和1种鹦形目鸟类线粒体全基因组序列,并结合NCBI公共数据库中释放相关数据进行雀形目线粒体系统发育基因组学研究。构建系统发育树所用物种共260种(内类群),隶属于雀形目57个科。利用IQ-tree(UBFboot)和RAxML(bootstrap)两种软件构建最大似然树,结合Mrbayes构建贝叶斯树,结果认为:(1)支持将雀形目划分为新西兰鹪鹩(Acanthisittidae)、鸣禽(Oscines)和亚鸣禽(Suboscines)三个支系,新西兰鹪鹩应该独立为一个类群,位于整个雀形目的基部位置;(2)鸦小目为并系类群,其中基部鸦小目(basal Corvida)为鸣禽的基部类群,冠部鸦小目(crown Corvida)为单系类群;(3)噪眉属的黑脸噪鹛(Garrulax perspicillatus)位于蓝噪眉属内,这两个属均为并系类群;(4)亚鸣禽沿着地理界限可划分为2个单系类群:新世界亚鸣禽和旧世界亚鸣禽;(5)褐背拟地鸦和北红尾鸲(Phoenicurus auroreus)为姐妹群,被包围在鹟科内部,初步建议将褐背拟地鸦从山雀科移到鹟科的红尾鸲属;(6)鹟总科为并系类群;(7)垂耳鸦科(Callaeidae)、缝叶吸蜜鸟科(Notiomystidae)、啄果鸟科(Melanocharitidae)、鸲鹟科(Petroicidae)、戴菊科(Regulidae)、丛莺科(Hyliotidae)、山雀科(Paridae)、攀雀科(Remizidae)和夏威夷吸蜜鸟科(Mohoidae)等9个科分类学位置尚未确定。6.线粒体重排类型及控制区系统发育学通过对260个雀形目鸟类线粒体重排类型进行分类,发现有66种雀形目鸟类为非“Ancestral avain”基因组重排类型。在亚鸣禽中,有7种鸟类为r_CR2类型。鸣禽中,缝叶吸蜜鸟(Notiomystis cincta)和欧歌鸫(Turdus philomelos)为d_tPro-CR类型;鸲鹟科(Petroicidae)5种鸲鹟属(Petroica)鸟类为r_CR2类型;本研究莺总科鸟类均为d_CR或r_CR2类型,共51种,占整个非“Ancestral avain”重排类型的77.27%;其余物种均为Ancestral avain类型。利用控制区保守序列对莺总科进行系统发育分析,发现所有d_CR类型的CR1和CR2均聚为一支,从而表明控制区复制事件发生在物种形成事件之前。本研究通过PCR扩增和一代测序技术以及高通量测序技术对部分雀类线粒体转录组或基因组进行测定,并结合NCBI的相关数据,通过多种方法联合构建系统发育树,对雀形目线粒体系统发育基因组学进行研究和讨论。研究涉及的雀形目鸟类多达260种,研究结果将有助于解决对雀形目内部系统发育争议。同时,本研究将雀形目系统发育关系与线粒体重排类型相关联,研究结果为线粒体重排类型多次独立起源理论提供了更多的证据,并表明线粒体重排类型和线粒体控制区具有系统发育学意义。此外,本研究首次从组学水平对雀形目鸟类NUMT进行探测、验证和分析,这些数据对进一步讨论鸟类NUMT形成的分子机制、序列特征、进化特点、生物学功能等奠定了重要的基础。