论文部分内容阅读
该博士学位论文由相互联系的三部分内容组成。第一部分:绒毛特异性基因蕴藏了人类多种癌症的预后分子标志物背景:肿瘤的发生发展与胎盘的发育有很多相似的生物学行为,但两者之间的关系尚未得到很好的探索。绒毛是胎盘发育的一个关键时期,涉及许多生物学过程,如滋养层细胞活跃的分裂增殖能力,逃避母体的免疫排斥,植入到子宫蜕膜及肌层等。而肿瘤细胞可能劫持了滋养层细胞的特性,两者有很多相似的生物学行为。目的:通过比较正常妊娠人工流产术后绒毛组织和成熟胎盘叶状绒毛膜组织的变化,探讨肿瘤的相应特征,为肿瘤研究提供新的途径,寻找新的癌症诊断和治疗靶点。方法:收集36例正常妊娠人工流产术后的绒毛组织和8例成熟胎盘的叶状绒毛膜组织,进行了全基因组表达谱芯片检测。结合The Cancer Genome Atlas(TCGA,癌症基因组图谱)泛癌的转录组数据,利用生物信息学的方法鉴定出早期绒毛特异性表达基因,并通过GO以及KEGG富集分析,观察其主要参与的生物学功能和通路,最后确定这些特异性基因在泛癌中的改变并且评估与患者预后的关系。结果:首先,通过与成熟胎盘叶状绒毛膜组织相比,我们鉴定出237个在早期绒毛组织中特异性表达基因,这些特异性基因主要参与的生物学功能有细胞增殖、免疫相关的反应、粘着斑等,而且这些特异性基因在多种癌症中都有表达水平的改变。接着,我们从相应的显著富集的功能中提取6个增殖、5个免疫和8个局灶性粘附相关的基因,发现这19个基因在泛癌的基因组水平上也发生了改变。最后,利用生存分析发现,增殖、免疫、局灶性粘附相关的基因分别与多种肿瘤的不良预后显著相关。结论:本研究是基于绒毛特异基因表达的相关研究,表明胎盘发育和肿瘤发生发展之间存在共同的生物学特征。因此,系统地分析多种肿瘤中绒毛特异性基因的改变情况,可以为识别新的预后生物标志物提供线索。第二部分:利用人绒毛发育模型鉴别结直肠癌预后生物标志物背景:肿瘤的发生发展和胎盘发育共享许多生物学特征,如细胞增殖、植入/侵袭、代谢和免疫逃逸等,所以滋养细胞又被定义为“生理转移”或“假恶性组织”。然而,胎盘绒毛的发育是一个生理过程,遵循特定的规律;肿瘤发生发展是一个病理性过程,不受机体的调控,不加干扰会无限地进行下去。于是我们提出假设,当肿瘤中基因与基因之间的相互作用关系偏离了绒毛发育中基因与基因之间的相互作用关系,则更易发展成肿瘤或肿瘤的恶性度更高,患者的预后更差。目的:鉴别出结直肠癌中基因与基因相互作用偏离早期绒毛中基因与基因相互作用关系的基因,并进行验证,探索寻找结直肠癌预后标志物的新方法。方法:通过绒毛组织的RNA测序数据,结合本实验室的结直肠癌多阶段(正常结肠粘膜、低级别腺瘤、高级别腺瘤、结直肠癌)表达谱芯片数据和TCGA结直肠癌转录组数据,构建在早期绒毛与结直肠癌中的基因相互作用网络,鉴别出在结直肠癌中失调的基因,并通过免疫组织化学与细胞表型实验进行验证。结果:我们发现早期绒毛和结直肠癌共享许多生物学行为,如细胞增殖、代谢、免疫反应、上皮间质转化等,但是具体执行这些功能的基因是不同的,选取结直肠癌中基因与基因之间相互作用关系偏离绒毛中基因与基因之间相互作用关系的距离大于1的基因对,并且对这些基因进一步筛选,在结直肠癌的多阶段及TCGA结直肠癌的Ⅰ期到Ⅳ期中符合线性上升和下降的基因,最终鉴别出24个基因,如CHPF、MMP14、COL5A2等。在6个独立的结直肠癌队列中(TCGA,GSE39084,GSE14333,GSE17536,GSE39582,GSE29621),这24个基因的异常表达与较差的生存率显著相关。据我们所知,CHPF没有与结直肠癌相关的报道,我们对其进行了验证,免疫组化的结果显示CHPF是结直肠癌独立的预后不良因素,细胞表型的研究表明CHPF能促进细胞的增殖、抑制细胞凋亡、促进细胞迁移等。结论:我们的研究表明,绒毛发育是一个可靠和严格调控的模型,可以为人类癌症发生发展轨迹的研究提供新的探索方法,而且利用病理过程和生理过程中网络关系的不同为评估结直肠癌的预后发现新的生物标记物。第三部分:胎盘绒毛多组学特征基因与泛癌预后的相关性背景:肿瘤的发生发展与绒毛发育的相似性越来越受到研究者的重视,但目前主要在转录组水平对两者进行研究。随着技术的发展,各组学技术的出现为生物学和医学的研究提供了新的机会。一般,每种组学的每个特征都是通过单变量统计方法进行独立分析。而这种分析往往忽略了不同特征之间的关系,可能会遗漏关键的生物学信息,多组学数据整合分析可以为生物系统提供更系统更全面的信息。因此,胎盘绒毛的多组学数据分析可以成为肿瘤研究的更稳健的模型。目的:通过对绒毛多组学特征基因的鉴定,寻求能够预测肿瘤患者生存的生物标志物,为肿瘤的研究提供新的线索。方法:收集早期正常妊娠人工流产术后的绒毛组织及成熟胎盘的叶状绒毛膜组织,并进行DNA 850K甲基化芯片检测、RNA测序、蛋白质谱检测。通过生物信息学分析,评估DNA甲基化与RNA、RNA与蛋白表达值之间的相关性,再使用DIABLO(Data Integration Analysis for Biomarker discovery using a Latent component method for Omicsstudies)算法,鉴定多组学特征基因,并且评估这些多组学特征基因与肿瘤患者预后的关系。结果:经过相关性分析后,RNA和甲基化的显著相关性只有24.9%,而RNA与蛋白的显著性相关性只有17.8%,用显著相关的蛋白/RNA做KEGG通路富集分析,发现主要富集在代谢相关的通路中,说明更多蛋白的动态改变调节来适应生物学行为的营养需求。然后通过DIABLO算法,鉴定出57个多组学特征基因。为进一步筛选与预后相关的基因,选择RNA和蛋白表达方向一致,且都发生了甲基化水平改变的基因,最终有19个特征性基因,其中3个基因在早期绒毛中表达上调(CLDN6、GPT2、CHPF),16个表达下调(VWF、C7、CLEC3B、CNR1P1、SNTB1、RBP1、TRADD、RFTN1、SVEP1、RGCC、PRKAR2B、FABP5、CPQ、RRAS、CRIP2、IQGAP2),并且这19个基因在多种肿瘤中表达改变,也能很好的评估肿瘤患者的预后。结论:表观遗传组、转录组、蛋白质组之间的相关性不高,说明生物过程的调控很复杂,转录和翻译是两个不同的生物学过程,引起基因的表达、基因的转录调控和蛋白差异的原因有很多。另外,经绒毛多组学数据鉴定的多组学特征基因大部分在TCGA很多种肿瘤表达失调,而且能够很好的预测患者的预后,表明从发育的角度,用多组学数据探索肿瘤的预后有很高的价值,为肿瘤的研究提供新的方向,为肿瘤标志物的发现提供新的方法。