【摘 要】
:
肺癌的发病率和死亡率中在恶性肿瘤均位于首位,在中国也是最为常见的恶性肿瘤。肺癌的不同组织学亚型有不同的生物学行为,恶性程度、转移倾向、不同治疗敏感度等需要进行肺癌组织学诊断后才可得出结论。临床上组织学检查有多种取样方法,但均为有创的检查手段。电子计算机断层扫描(Computed Tomography,CT)影像是肺癌诊断的有效方法,本文基于CT影像,采用机器学习方法,探寻人工智能技术对肺鳞癌与肺腺
论文部分内容阅读
肺癌的发病率和死亡率中在恶性肿瘤均位于首位,在中国也是最为常见的恶性肿瘤。肺癌的不同组织学亚型有不同的生物学行为,恶性程度、转移倾向、不同治疗敏感度等需要进行肺癌组织学诊断后才可得出结论。临床上组织学检查有多种取样方法,但均为有创的检查手段。电子计算机断层扫描(Computed Tomography,CT)影像是肺癌诊断的有效方法,本文基于CT影像,采用机器学习方法,探寻人工智能技术对肺鳞癌与肺腺癌分类的应用价值。本研究首先使用影像组学机器学习技术针对193例CT影像的病灶提取包括灰度统计量的强度特征、肿瘤形状-大小特征以及多种纹理特征的1409个特征,使用合成少数过采样方法(synthetic minority oversampling technique,SMOTE)对训练集的特征进行数据扩充,以消除不同子类型之间的不平衡,采用方差分析与最小绝对收缩和选择算法进行特征筛选,选择出对鳞癌与腺癌分类更有价值的特征。使用支持向量机(support vector machine,SVM)、逻辑回归(logistics regression,LR)、多层感知机(multilayer perceptron,MLP)方法构建不同的传统机器学习模型,并使用网格搜索结合5折交叉验证的方式选择最优模型参数,使用受试者工作特征曲线(receiver operating characteristic curve,ROC)、敏感性及特异性进行模型评估。结果显示,71个特征具有良好效果,使用独立测试集对机器学习模型评估发现,MLP和LR显示出良好性性能,SVM的模型效果较差。本研究尝试使用深度学习技术实现肺癌两种亚型端到端的分类,采用迁移学习弥补数据量较少的缺陷,应用组归一化(Group Normalization,GN)改进深度残差网络(residual networks,Res Net),搭建Res Net GN深度学习网络,对肺结节良恶性分类的源网络进行微调(fune tuning)。首先针对图像获取合适的网络输入作为感兴趣区域(region of interest,ROI),将数据分为训练集和测试集,对训练集数据进行旋转、镜像的扩充,随后经预处理之后裁剪不同的大小输入经预训练的Res Net GN网络。优化网络参数后显示,针对193例数据的分析中,Res Net GN的2D模型效果优于3D模型,且迁移学习对模型性能有较大提升。本文对比了三种传统的机器学习方法以及不同输入大小的深度学习方法,深入挖掘影像信息,获取肺癌的影像特征,构建了基于CT影像的肺腺癌与肺鳞癌分类模型。实验证明,机器学习方法具有较强的影像信息挖掘能力,经更多数据学习、多中心验证后可应用于临床实践,进而辅助医师制定合理治疗方法。图30幅,表4个,公式15个,参考文献51篇。
其他文献
机关建设项目是各级政府为提升执政能力、保障机关运行,使用财政经费等资金进行的基本建设项目,加强项目的绩效管理对于提高项目资金使用效益有着现实意义。现有绩效评价方法主要采用项目中间评价和后评价,旨在为建设计划调整和后期项目决策提供参考,但无法优化项目建设实施过程。本文通过分析机关建设项目绩效评价现状,构建过程绩效评价体系,提出过程绩效评价方法,以实现对项目建设过程动态监管。主要研究内容及成果如下:(
随着电子商务的发展,消费者对于网络购物日渐熟悉,线上渠道竞争也日趋激烈,在这种环境下,一些线上商家开始将目光转向线下渠道,发展双渠道的运营模式。双渠道的运营模式有利于企业拓展市场,整合线上线下渠道,甚至可以快速响应客户的需求,使得企业在市场竞争中保持一定的优势。本文研究的W公司也正是在这样的大环境下,开始探索双渠道的运营模式。目前,W公司在双渠道下采用的是分散式库存管理模式,公司和其经销商均通过销
精密减速器作为工业机器人的重要构件之一,具有传动精度高、承载能力大、运行平稳及可靠性高等优势。国内精密减速器经过数十年的发展,已经实现了从无到有、从小到大的过程,但产品存在传动精度及精度保持性差、质量一致性差、疲劳寿命及可靠性差等缺陷,与国外产品还有较大差距。国内关于减速器疲劳寿命测试技术研究方法资料较少,测试设备也不健全,主要原因在于硬件成本高、测试耗时长,且对设备的精度和可靠性有着严格要求。因
负债融资是企业主要的融资方式之一,随着近年来宏观政策的收紧,国内债券刚性兑付的记录逐渐被打破,这在发达的债券市场已是常态。与此同时,再融资困难是阻碍广大企业经营发展的首要难题,世界各国政府都在积极寻求措施来减轻企业负担。影响企业债务融资成本的原因不仅包括外部政策经济环境,也包括企业自身的战略规划、经营效率、现金流管理能力等。然而,在当前产业链生态环境中,企业之间合作紧密,学术界对上下游企业经济关联
本文针对多项时间分数阶慢扩散方程提出了一类紧致有限体积方法.该方法建立在有限差分方法基础之上,它用有限体积方法离散空间导数,用经典1插值离散时间分数阶导数.该格式具有良好的积分守恒性.全文共分为四章,第一章为绪论,介绍了多项时间分数阶慢扩散方程的物理背景和紧致有限体积方法的发展历程,并介绍了此类方程的研究现状.第二章针对一维多项时间分数阶慢扩散方程提出了一种紧致有限体积格式,该格式所形成的线性代数
Heusler磁性形状记忆合金是一种新型的形状记忆材料,它不仅具有传统形状记忆合金的受温度场控制的热弹性形状记忆效应,同时还兼备受磁场控制的磁性形状记忆效应。这一特性也
1,6-己二醇是一种重要的化工原料和中间体,本课题组开发出一种用于己二酸二甲酯催化加氢的铜基催化剂并成功进行了催化剂粉体的放大制备。在此基础上,本研究对催化剂的成型设
汉语字谜是以单个汉字为谜底的谜语。字谜的谜面根据汉字音、形、义某一方面的特征,对谜底汉字的间架结构进行了生动多样的描述。针对字谜的语义理解与建构有多种解读,本文采
干旱和半干旱生态系统的表面能量平衡能够反馈于局域和区域气候,在碳水循环方面极其重要。典型沙生灌丛生态系统在中国北方干旱与半干旱区分布广泛,其能量交换过程极其容易受
H13钢是一种在模具行业和关键零部件中都具有广泛应用的模具钢。但是该类材料在具备高硬度的同时,其冲击韧性却大幅降低,限制了其在高冲击、强磨损工况的使用。为解决这一问