论文部分内容阅读
随着计算机技术、多媒体技术及Internet的迅速发展,基于内容的图像检索成为多媒体领域最活跃的研究热点之一。它结合人工智能、计算机视觉、模式识别、心理学等研究领域,通过对图像提取一定的特征,找出在特征空间中与查询要求接近的图像,从而实现在图像数据库中自动地、智能地检索、查询和管理图像。
基于内容的图像检索目前存在的问题是,图像的低层视觉特征并不能反映图像真正的语义信息,即存在着底层视觉特征与高层语义之间的“语义鸿沟”。为克服“语义鸿沟”,近年来已提出了一些方法,如感兴趣区域检索、相关反馈和分类模型,本文对当前的一个研究热点-基于“感兴趣区域”的图像检索,提出基于ROI的网格商空间多粒度图像检索。
首先,介绍了基于内容的图像检索的研究背景及意义、国内外的研究现状和典型的CBIR系统。系统分析和研究了此领域的一些关键技术,如:颜色、纹理、形状等底层特征提取方法,图像间的相似性度量方法,以及相关反馈的相关知识。
其次,介绍了商空间粒度理论及其在图像分析里的应用。针对目前图像检索中存在的“语义鸿沟”问题,提出综合商空间粒度和网格理论的基于ROI的图像检索技术,并融合颜色、纹理和形状等底层特征,结合基于方差分析的相关反馈技术进行检索。使得系统具有较好的人机交互性能,能显著缩小“语义鸿沟”。
最后,本文设计完成了基于ROI的网格商空间多粒度图像检索系统。该系统使用网格对图像进行划分,提取图像不同粒度下的各种底层特征存储在特征库,由用户选择的感兴趣区域,根据商空间粒度合成原理,返回查询结果,用户根据查询结果进行相关反馈。试验结果表明,此系统能较好地缩小“语义鸿沟”,具有较高的查准率和查全率。