基于特征编码及显著性的肠道息肉识别算法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:zhuzhuzhilian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
息肉是人体消化道最常见的疾病之一,可导致高危癌前病变。息肉的及时检测和治疗对预防癌变和节省医疗支出具有重要作用。内窥镜是目前用于采集肠道息肉图像的主要手段。但是由于内窥镜产生的图片数量庞大,并且息肉的形态和大小多样,对息肉的识别效果主要取决于医生的经验技能,导致通过人工的方式进行息肉的检测常常会加重医生负担和造成漏诊。因此,息肉自动检测的研究对于缓解临床医师的压力和提高诊断的可靠性具有重要意义。本文的研究内容和贡献主要包含以下三个方面:(1)基于特征编码的肠道息肉识别和基于显著性检测的定位系统设计现有的辅助诊断系统通常是单一的图片分类和病变定位,并且缺乏针对特定场景和疾病的设计,本文提出了针对肠道环境下融合息肉图片识别和息肉区域定位的一体化系统。该系统分为两大部分。第一部分:首先利用特征及特征编码算法将内窥镜图像的主要信息提取出来,然后通过池化方法对编码后的特征进行汇聚,最后输入到分类器中,从而实现息肉图片和正常图片的二分类任务。第二部分:在判别到的息肉图片中,利用基于显著性的目标识别算法,生成对应的显著性图,根据显著图中各个区块的显著值大小,进一步检测息肉生长区域,辅助医生诊断。该系统能够完成在大量的肠道内窥镜图片中进行息肉图片的分类和息肉区域定位的任务。(2)基于特征编码的息肉图片分类方法目前主流的特征编码方法主要集中在目标函数上,而忽略了初始码本中各个基向量之间的内在关系。由于最终输入到分类器中的特征编码是由码本决定的,因此码本的设计是值得进一步研究的。此外,很少有研究考虑到肠道管状结构对息肉图片分类的影响。因此,本文提出了一种基于环形空间金字塔匹配(Annular Spatial Pyramid Matching,ASPM)的显性码本局部约束线性编码(Salient Codebook Locality-Constrained Linear Coding,SCLLC)的息肉图片自动识别方法。首先,从包含正常图像和息肉图像的样本中提取详细的纹理特征,并对特征采用K-means聚类方法得到初始码本。其次,利用所提出的SCLLC算法将初始码本转换为显性码本,并利用该码本对特征进行编码。再次,为了提高肠道图像处理的效率,提出了一种基于空间金字塔匹配的环形区域分割最大池化策略,对计算得到的特征编码进行池化。最后,运用支持向量机(Support Vector Machine,SVM)分类器来执行息肉图像的分类任务。实验结果表明,该算法在肠道息肉图像分类方面取得了94.10%的准确率、91.20%的敏感性97.01%的特异性,优于现有的基于特征编码的主流方法。(3)基于显著性的息肉区域识别方法现有的显著性检测算法通常采用四周边缘作为背景先验,采用图片中心作为目标中心先验,常常无法正确识别肠道图片的背景区域,并且无法处理多个目标位置。因此,本文提出一种基于肠道中心及轮廓背景先验的显著性息肉检测算法。首先提出基于暗区的肠道中心以及基于边缘的肠道轮廓检测方法,并以此作为背景先验,然后运用平均测地距离来度量图片不同区域的相似性,进而对背景区域进行拓展,最后提出一种多连通区域的高斯中心先验模型,对显著图进行优化得到最终的检测结果。实验结果表明,在最终的显著图对比中,相较与主流的显著性检测算法,本文算法能够更好地检测到肠道的背景区域,并能够有效地凸显多个显著性息肉目标。
其他文献
面部情感识别旨在判断表情所传达的情感倾向,智能感知个体情绪状态,具有重要的研究价值,已成为计算机视觉领域中的研究热点。为此,针对现有面部情感识别模型的不足,本文从图
我国是农业大国,农业信息化在我国农业现代化发展过程中扮演着重要角色。近年来,互联网信息资源的爆炸式增长,使农业生产者无法准确高效地获取目标信息。为解决以上问题,帮助
本文针对卡片打印质量检测问题,设计一种基于计算机视觉和图像处理技术相结合的检测方法。用工业相机拍摄待检测的卡片,采用张正友标定方法对相机进行标定,利用虚拟像平面模
近年来中国房地产市场迅猛发展,但房地产价格的过快上涨也成了社会焦点问题。“土地财政”被认为是房地产价格上涨过快的原因之一,土地的价格和出让行为一直是学术研究的关注
随着社会经济和科学技术水平的提高,人们对获取物体立体形貌的需求也逐渐提高,光学三维测量技术以其非接触、全场性、自动化程度高等特点,在逆向工程、装备制造与质量检测、
随着我国交通和经济的快速发展,桥梁数量日益增加,对于桥梁的健康监测也极为迫切。因此,对于桥梁结构的实时监测、状态评估、预警处理和损伤识别是目前研究的趋势。故本文在
现如今,互联网技术飞速进步,信息安全问题逐渐进入人们视野。入侵手段的多样化以及存储数据的爆炸式增长使得传统的入侵检测手段已经不能满足当前网络安全的所有要求。现阶段已有的基于溯源的入侵检测方式存储数据量过大,时间开销较大,检测准确率较低。针对现阶段入侵检测技术在检测效果和空间开销上的问题,提出将卷积神经网络技术与溯源入侵检测技术相结合以提高检测方式的可用性。针对数据量过大的情况,提出将溯源图信息转化
近年来,复杂网络的动力学行为已经引起了大量研究者的注意,特别是复杂动态网络的无源性和输出同步问题。在现有的文献中,研究的都是非导数耦合的网络模型。实际上,在一些现实
随着收入水平的提高,旅游成为人们丰富其精神生活的重要途径,因此旅游业迅速发展,个性化旅游模式应运而生。个性化旅游行程的制定涉及用户兴趣爱好、旅游景点流行度、地理位置等多个影响因素,是极其复杂且耗时耗力的工作。旅游网站和移动应用中记录了大量游客的历史旅游记录,反映了景点的特征以及用户对旅游景点的偏好等信息。有效利用这些数据为游客推荐行程、规划路径可大大降低游客的工作量,提升用户体验。传统的旅游推荐主
项目增补(Item Replenishing)对认知诊断计算机自适应测验(CD-CAT)题库的开发和维护有着至关重要的作用。在CAT或CD-CAT框架下,在线标定是一种重要的项目增补方式。然而,目前CD-CAT中可同时标定Q矩阵与项目参数的在线标定方法寥寥无几,且已有的方法均是基于决定型输入噪音与门模型(DINA)提出,这些方法可能无法直接适用于更一般化的认知诊断模型。本文的目的在于开发既能适用于