论文部分内容阅读
随着各种医学影像设备的大量涌现,医学图像成为现代临床诊断和医学研究中不可或缺的工具。面对这些海量的医学图像数据,如何有效地组织、管理和检索大规模的医学图像数据,已经成为当前迫切需要解决的问题。随着图像归档与通信系统(Picture Archive and Communication System,PACS)的发展,它解决了数字医学图像的获取、显示、存储、传输和管理,而保证PACS成为全开放系统的重要标准和协议是医学数字成像和通信标准(Digital Imaging and Communication in Medicine,DICOM)。在目前的DICOM网络中,图像的检索都是基于文本进行的,这种检索方式很难反映出医学图像所蕴含的丰富信息,传统的文本检索技术使得医学图像在医学诊断和研究等领域的应用受到了极大的限制,基于内容的图像检索技术(Content-Based Image Retrieval,CBIR)应运而生。它的主要思想是根据图像的视觉内容特征,如颜色、纹理、形状、空间关系等,建立图像的特征矢量,在数据库中查找具有与待查询图像特征矢量最为相近的特征矢量,并按相似度高低返回给用户原图像,此类的检索一般不含文本信息的检索,而在临床实践中,从病人姓名或年龄等查询图像的需要始终存在。本文深入分析了医学图像检索的特点,根据用户的不同需求和目的,提出了一种多级检索模式。此模式将文本检索与视觉内容检索相结合,可以让用户对图像有不同检索需求的情况下,逐步缩小检索的范围从而查找满足需要的图像。实验中,一级检索是基于文本数据的检索,首先在保证目前DICOM网络中传统文本检索方式的基础上,改变原有人工录入数据的方式,通过解析DICOM文件中图像所含有的信息实现文本数据的自动提取和录入,这些信息包含了医院环境下图像所涉及的绝大部分信息,包括患者、研究、序列、图像等信息,并通过这些文本信息建立索引。基于DICOM的文本检索能够使用户通过已知的图像外部信息查找图像,也能够限定图像检索的范围,如图像类型、病人年龄等,使检索的内容更加详细具体,减少了人工录入的工作量和错误率,提高了数据录入的速度。二级和三级检索是基于医学图像视觉内容的检索,由于不同医学图像以及不同成像模式所适用的感兴趣分割方法和需要提取的特征有很大不同,为了检测多级检索模式的可行性,本文选取了具有明确病理诊断分类的乳腺X线图像作为基于视觉内容检索的目标图像。实验分别设计了针对乳房主块区域的检索和对感兴趣区域(Region of Interesting,ROI)的检索,首先对乳腺图像进行预处理,通过去除背景、胸肌、横向边框等噪声,提取乳房主块区域,然后通过主块区域提取的统计纹理和形状特征向量建立特征向量库,通过对向量间相似性的比较,实现二级检索,并在乳房主块区域检索结果的基础上,对这些图像感兴趣病灶区域进行特征的提取并建立索引,实现三级检索,实验结果表明,分级检索可以更加针对用户感兴趣的信息和目标区域进行检索,有利于提高用户对检索结果的满意度。由于基于视觉内容检索时所选取的特征向量具有一定的冗余性,为了得到更好的特征参数,实验选取90例图像对其进行主分量分析,这样去除了特征中一部分冗余信息,降低了特征比较的运算量,提高了系统的检索能力。最后,实验给出了基于视觉内容二级检索和三级检索的查全率和查准率关系图,结果表明,三级检索的结果优于二级检索,进一步验证了分级检索的可行性和实用性。