论文部分内容阅读
癌症的危害不言而喻,早期发现治疗至关重要。计算机辅助病理图像检测减轻了病理学家的工作量,有助于降低误诊率,具有很重要的临床价值。数字组织病理学图像分析中的两大基本任务为图像分类和图像检测,在全切片(WSI)上准确检测出病变区域是数字病理诊断和分级任务中的关键步骤。苏木精-伊红(HE)染色法能较好地显示组织结构和细胞形态,且染色后切片可以长期保存,优势明显。基于此,本文主要研究基于HE染色切片的病理图像检测分类算法,主要包括分类模型的训练和病理切片的检测两部分。在训练分类模型时,采取两种基于深度学习的方法进行,并对两种方式训练的分类模型进行性能评估,选取表现较优的分类模型用于病理切片检测;病理切片检测分为大幅图像区域检测和全切片检测,针对全切片的癌变区域检测改进了已有的自适应采样算法,进行大量实验证明改进算法的优越性。本文的主要研究工作如下:(1)研究基于HE染色的病理切片图像特点,根据颜色差异从WSI中提取感兴趣区域。依据病理学家标注分别提取三种倍镜下的区块图像制备三种样本集。针对不同来源的切片图像颜色差异问题,对区块图像进行颜色归一化操作。(2)采取两种方式训练分类模型。一是在研究DenseNet和SE-DenseNet结构的基础上,应用轻量化及内存优化后的DenseNet网络训练卷积神经网络(CNN)模型;二是采取迁移学习方式训练分类模型,分别利用InceptionV3等9种常见CNN模型完成特征提取,再利用提取的特征训练SVM、RF分类器或是直接训练一个全连接层生成分类模型。对于每种训练方式,分别训练三个倍镜下的分类模型,并评估各模型的性能,选取表现最优的分类模型用于病理切片检测。(3)研究并实现大幅病理图像区域检测及全切片检测算法。一是针对大幅病理图像的区域检测,提出联合多个倍镜进行分析。先在低倍镜下检测,针对低倍镜检测置信度不高的区域再次在高倍镜下检测分类,并利用SLIC算法对图像进行区域聚类以平滑检测的癌变区域边缘部分。将检测结果与病理学家标注进行比对,定量评估检测效果;二是针对全切片进行自适应迭代采样检测。先对全切片进行初次采样得到区块图像,根据采样位置及区块对应的癌变概率对全图进行插值操作生成癌变可能性热图,再根据热图的梯度图选取下一次采样点的位置。针对已有采样算法流程不足之处进行改进,提出三阶段采样法并设置基于采样密度的迭代停止条件以提高检测效率及精度,大量实验并评估改进后算法的性能。