论文部分内容阅读
近30年来新发现的病原体已多达数十种,其中有很多是由病原性细菌引发的感染性疾病。微生物的自然进化、重组是导致新病原体出现的内在因素;同时随着生物技术的迅速发展与普及,人工构建新型重组病原菌也已成为可能。因此,面对未来可能出现的新病原菌以及新型重组的生物恐怖病原菌,必须建立起快速检测鉴定的有效方法。与病原体致病性紧密相关的基本元件是病原体的致病相关基因、毒力基因、抗性基因以及病原体的种类(菌种特异性基因)等,利用对上述基本元件的检测,可以达到对新型病原体或重组病原体进行检测鉴定。但是目前对于毒力因子的研究鉴定还很不完整,尤其是单个致病菌菌株中已鉴定的毒力因子还无法解释其全部的致病过程,例如:目前已知的研究比较全面的致病性大肠杆菌O157:H7的毒力因子等。也就是说现有的毒力因子数量还不足以完成致病菌的毒力与毒力重组分析,因此我们首先对现有毒力因子进行系统分析研究,希望从中发现某些规律。近年来研究发现:部分已鉴定的致病菌毒力因子同样出现在非致病菌基因组中。为了对这一问题有一个清楚的了解,我们对一些公共的毒力因子数据库进行比较分析后,选取VFDB(Virulence factor database)毒力因子数据库并从该数据库中下载了来自于已完成全基因组测序的51株致病性细菌菌株中的1988个毒力基因,采用直系同源基因预测的方法,根据每一个毒力基因在非致病菌中有无直系同源基因,将毒力基因分为致病菌特有毒力基因和共有毒力基因,总共获得了620个致病菌特有毒力基因和1368个共有毒力基因,分别占据毒力基因总数的31.19%和68.81%。众所周知,致病菌中的毒力岛和致病菌的致病密切相关。因此我们首先系统研究了毒力基因和致病菌中毒力岛的关系,研究结果发现致病菌特有毒力基因倾向于分布在毒力岛上,而共有毒力因子更倾向于分布在毒力岛之外。这就提示我们:致病菌特有毒力基因和致病菌的致病有着更加紧密的联系。然后我们按毒力因子数据库VFDB上对毒力基因的分类,将1988个毒力基因归类到49个毒力因子功能类中,对每一个毒力因子功能类在致病菌特有毒力基因和共有毒力基因上的分布进行了统计分析,结果发现:外毒素、三型分泌系统中效应蛋白和未分类蛋白、四型分泌系统和毒力岛等毒力因子功能类更倾向于分布在致病菌特有毒力基因上;而鞭毛、荚膜、内毒素、离子代谢、六型分泌系统、调控基因和二型分泌系统等毒力因子功能类更倾向于分布在致病菌共有毒力基因上。同时在各功能类的统计结果中,我们发现有一部分外毒素基因同样出现在共有毒力基因中,因此我们进一步对所有外毒素基因进行了统计分析,结果发现大部分的外毒素基因都是致病菌所特有的,而对于那些未包含在致病菌特有基因中的外毒素基因,经过相关文献调研,我们发现这部分外毒素基因或者不是真正的外毒素(主要功能与外毒素分泌相关),或者它们是否是外毒素目前仍存在争议。同时经过相关文献调研,我们还发现大部分四型分泌系统效应蛋白基因也是致病菌所特有的。最终经过对倾向于分布在致病菌特有毒力基因和共有毒力基因中的各功能类在致病过程中的功能角色的分析比较,我们得出:致病菌特有毒力基因可能更直接参与致病菌毒力的形成,而共有毒力基因主要与致病菌致病的结构及基础功能更相关(基本生物学过程),更倾向于参与与宿主的一般相互作用。通过对现有毒力因子的系统分析研究,我们发现:对于新病原体或重组病原体的检测鉴定,利用致病菌特有毒力基因分析能更准确的反映致病菌的毒力与毒力重组。但是目前已鉴定的致病菌特有毒力基因数据量太少,而整个细菌基因组相对庞大,直接分析困难;并且基因组中与毒力不相干的成分太多,干扰结果判读。因此,我们拟将致病菌特有毒力基因放大,提出了致病菌特有基因:即只在致病菌中出现而在非致病菌中不包含的基因。首先,从NCBI GenBank上下载已完成全基因组测序的细菌菌株的全基因组蛋白质序列,构建了致病菌蛋白质数据库和非致病菌蛋白质数据库,利用设计的基于样本库减模式的相似性比对方法对致病菌特有蛋白进行了预测。预测结果中致病菌特有蛋白总数约占致病菌基因组总蛋白的10.15%,这样就大大减少了整个基因组的数据量,并且将致病菌致病相关基因得到富集。在得到致病菌特有基因的基础上,通过对未知病原体全基因组进行分析,可以利用基于基因检测技术来确定一个病原菌中可能存在的所有毒力基因、抗性基因以及菌种特异性基因,是否存在外源毒力基因或抗性基因,这些基因组成与现有已知致病菌有何异同,我们就可以推测出此病原体是否为已知病原体、重组病原体或新病原体,它是由什么原始病菌或非致病菌改构而来的,它含有什么新的毒力基因、抗性基因等,它可能的致病机制是什么。但是,基于基因检测的技术对于那些经过体外进化或片段重组的新型改构毒力基因可能无效。我们知道:功能的最小单位不是基因而是功能基团,那么无论是使用体外进化还是片段重组等技术所发展的新型毒力或抗性基因,都离不开基本功能基团的复用,因此从理论上来说,对于未知病原体的检测鉴定采用基于功能基团的检测技术将具有更大的优势。为此,我们对获得的致病菌特有蛋白进行了特有功能基团的识别研究,主要通过利用InterProscan分析工具对致病菌特有蛋白序列和非致病菌蛋白序列进行功能基团识别,最终比较获得了370个致病菌特有功能基团。经过对仅在细菌上有分布的242个致病菌特有功能基团在致病菌上的统计分析,我们发现致病菌特有功能基团可以代表许多致病菌的毒力或致病性,并且致病菌特有功能基团具有属、种、株特异性以及特定感染途径特异性。因此基于功能基团的检测,可以发现新病原体具有某菌属或菌种的相同或相似特征,进而提示新病原体的可能致病机制以及可能的重组来源。但是在致病菌特有功能基团的识别结果中,大部分致病菌特有蛋白未包含已知的功能基团,这主要是由于目前已确定的功能集团数量依然太少,那么下一步的问题就是如何确定和发现新的功能基团。功能基团的本质是在进化过程中蛋白质具有的局部高度保守的序列片段。在微生物进化过程中,由于多功能基因融合事件的出现,将会导致致病菌特有蛋白质序列中出现非致病菌蛋白质功能基团,也就是说致病菌特有基因序列中会出现部分非致病菌基因序列,这样就会影响我们对致病菌检测结果的判读。因此,可以通过寻找致病菌特有基因的保守序列片段来代替寻找新的功能基团;这样无论未知病原体来源如何,都能检测出一定的保守序列,根据这些序列在已知病原菌中的分布情况,就能对未知病原体进行检测和鉴定。对于致病菌特有保守序列片段的识别,我们主要通过将获得的致病菌特有基因序列打散,去除生物学意义上的干扰序列片段以及在非致病菌基因组中出现的片段,最终得到了长度为29 mer的致病菌特有基因片段115,152条。初步分析这些片段的分布,发现致病菌特有基因片段在各致病菌菌种和菌株上分布具有均衡性;接着我们完成了致病菌特有基因片段在不同致病菌及其基因中的分布,包括致病菌中各菌属、菌种、菌株以及各基因上的特异性特有片段分布,构建了致病菌特有指纹数据库。为了验证致病菌特有指纹库中致病菌特有基因片段的特异性,我们对新完成全基因组测序的3株致病菌菌株进行了模拟杂交(这3株菌不包含在我们的研究数据中)。杂交结果表明:利用致病菌特有基因片段能很好的区分致病菌的种属与重组。此外,基于获得的致病菌特有保守片段,我们设计了等温探针设计算法,按照特有片段的分布共设计等温探针29,169条,构建了致病菌特异性探针数据库。这样基于构建的致病菌特有指纹库和致病菌特异性探针数据库,就可以结合小片段测序技术或芯片技术来确定未知病原体的种属特征,毒力组成及毒力重组信息。