论文部分内容阅读
研究背景:目前,肺癌是我国以及全球发病与死亡排名第一的恶性肿瘤。据2018年一项流行病学统计数据显示,中国肺癌患者的五年生存率约为19.8%,略低于美国的21.2%,表明我国与美国等发达国家之间,在肺癌患者的生存及预后方面依旧存在着一定的差距。随着第二代测序技术的发展与应用,大量有关肺癌肿瘤基因组的研究表明,肺腺癌中常见的突变基因有表皮生长因子受体(epithelial growth factor receptor,EGFR)以及KRAS基因等,且中国肺癌人群与欧美肺癌人群的肿瘤基因组突变谱存在一定差异。例如,中国肺腺癌人群EGFR突变率约为50-60%,高于美国的15-20%,表明EGFR基因对于我国肺腺癌患者十分重要。目前有关研究表明,在DNA水平上的某些基因突变,会导致氨基酸排列顺序改变,引起基因所编码蛋白质或酶的结构或数量异常,对蛋白质或酶的活性和功能以及机体的生理活动产生影响,并且随着细胞中基因突变的不断累积,最终可能导致肿瘤等疾病的发生。因此,越来越多的研究者致力于剖析肿瘤基因组层面的突变图谱,例如发现基因突变的发生位置与类型不同会对基因表达造成不同的影响,但目前基于靶向捕获测序,针对肺腺癌常见突变在基因所编码蛋白质一级结构上的分布,以及针对不同肺腺癌人群突变分布模式的比较分析,目前还缺乏较为广泛地探索与研究。研究方法:本课题共收集到66例中国肺腺癌组织样本,全部为甲醛固定石蜡包埋标本,并对这些石蜡标本进行DNA取以及靶向捕获测序,共得到66例中国肺腺癌组织样本的原始测序数据,接着依次经过BWA、GATK4、Mutect2、Annovar等生物信息学软件对原始测序数据进行处理,获得肺腺癌患者的体细胞突变数据。此外,从肿瘤基因组图谱数据库(The Cancer Genome Atlas,TCGA)下载了173例肺腺癌组织样本(高加索人)的体细胞突变数据。运用R语言包绘制中国肺腺癌人群与欧美肺腺癌人群的基因突变特征谱,并对两组肺腺癌人群的肿瘤驱动基因、体细胞突变关联性进行了分析。然后通过绘制突变在基因所编码蛋白质一级结构上的分布图,运用香农熵算法衡量基因突变分布的聚集程度,比较了中国肺腺癌人群与欧美肺腺癌人群的基因突变分布差异,并试图进一步探究突变分布特征的影响因素。最后,对中国肺腺癌人群与欧美肺腺癌人群的基因成药性进行了比较分析。研究结果:(1)肿瘤突变谱分析显示,中国与欧美肺腺癌人群的EGFR、KRAS、BRD4、EP300、NSD1、PALB2、CREBBP等基因的突变率存在较大差异,中国肺腺癌人群EGFR突变率高于欧美(66.7%vs 15.4%),欧美肺腺癌人群KRAS突变率高于中国(34.6%vs 12.1%)。(2)通过中国与欧美肺腺癌人群的肿瘤基因组对比分析,发现欧美肺腺癌人群的C>A碱基颠换比例高于中国(39.7%vs.15.5%),两组人群的突变类型均以错义突变为主。(3)中国肺腺癌人群的肿瘤驱动基因主要为EGFR,欧美肺腺癌人群的肿瘤驱动基因主要为KRAS,且体细胞突变关联分析显示,在两组肺腺癌人群中EGFR突变与KRAS突变互斥发生。(4)相对于欧美人群,中国肺腺癌人群的突变在基因编码蛋白质一级结构上具有较为聚集的分布模式。(5)临床统计资料显示,中国肺腺癌人群晚期患者的比例高于欧美肺腺癌人群;晚期肺腺癌患者的肿瘤突变负荷(tumor mutation burden,TMB)高于早期患者。(6)基因成药性分析显示,在中国肺腺癌人群中识别到16种成药基因分类;在欧美肺腺癌人群中识别到21种成药基因分类。研究结论:(1)中国肺腺癌人群EGFR突变率较高,而欧美肺腺癌人群KRAS突变率高,与既往研究一致。(2)欧美肺腺癌人群的C>A碱基颠换比例高于中国肺腺癌人群,与欧美肺腺癌人群具有较高比例的吸烟者相关。(3)中国肺腺癌人群与欧美肺腺癌人群具有不同的肿瘤驱动基因,且体细胞突变关联性之间存在差异。(4)中国肺腺癌人群的突变在基因编码蛋白质一级结构上的分布模式比欧美肺腺癌人群相对聚集,即肺腺癌基因突变的分布模式存在着种族差异。(5)中国肺腺癌人群晚期患者比例高于欧美肺腺癌人群,且晚期患者的TMB高于早期患者,示基因突变分布的聚集程度可能与肿瘤进展相关。(6)中国肺腺癌人群和欧美肺腺癌人群有着不同的可成药基因。通过中国与欧美肺腺癌人群的肿瘤基因组对比研究,为识别两组肺腺癌人群的突变分布特征供了基础理论依据,为肺腺癌的发病机制、靶向药物研究供了一定线索,有利于帮助肺腺癌的临床诊断、分类、预后判断及治疗指导。