论文部分内容阅读
上皮生长因子受体(epidermal growth factor receptor,EGFR)是一种跨膜受体络氨酸激酶,对于肿瘤细胞的生长、增殖等相关信号的传递非常重要,亚裔肺癌患者中EGFR突变率约有50%。对于肺腺癌患者,在治疗前、治疗中明确EGFR基因突变状态是选择合理治疗手段的前提。现有的临床检测手段(病理检测)风险较高、有创且难以反复多次实施。本论文的研究工作基于肺腺癌患者胸部CT影像,通过影像组学和卷积神经网络的方法,建立无创、便捷、动态追踪识别肺腺癌EGFR基因突变的模型。本论文首先提出利用影像组学,从肺腺癌患者胸部CT影像中计算定量特征,并筛选具有区分能力的影像组学特征来训练判别肺腺癌EGFR基因突变状态的模型。基于影像组学的方法筛选出对基因突变状态具有显著判别能力的特征(P值小于0.05)186个,具有非常显著判别能力(P值小于0.001)的特征82个。将这些特征送入分类器训练之后建立的模型在验证集中的受试者工作特征曲线下面积(area under receiver operating characteristic curve,AUC)为0.766,准确率显著高于临床特征(性别和吸烟史)基准线(AUC=0.686)。由于影像组学特征提取过程具有不稳定性,本论文提出利用二维卷积神经网络将特征提取和特征筛选的步骤合并到分类步骤中,建立端到端的模型。通过采用多尺度尺寸融合、多角度切片和迁移学习的策略,获得了最优模型,对该最优模型进行多次测试,得到在验证集中的AUC值为0.838,显著优于影像组学模型。为了利用肿瘤CT图像的三维空间信息,本论文进一步提出三维卷积神经网络识别肺腺癌EGFR基因突变状态的模型。首先,本研究利用大量良恶性患者CT数据建立了三维医学影像的预训练模型。在预训练模型的基础上,利用肺腺癌EGFR基因突变患者CT数据进行迁移学习,得到了最优三维卷积神经网络模型,该模型在验证集中的AUC值为0.863,优于二维卷积神经网络。在获得影像组学模型、二维和三维卷积神经网络的模型之后,本论文对以上三个模型进行融合,构建了基于CT影像的融合模型。随后加入临床特征,进一步提高了模型的判别性能,在验证集中的AUC值为0.881,说明CT影像和临床特征中分别提取的信息具有互补性。与其他基于医学影像的研究结果相比,本论文所提出的基于CT影像的模型对肺腺癌患者EGFR基因突变检测的准确率更高,更接近临床要求。本论文研究结果表明,利用CT影像能够对肺腺癌EGFR基因突变状态进行检测,进而辅助临床决策,这为临床提供了一种无创、便捷、动态追踪、高效的检测方法。