论文部分内容阅读
近年来多媒体和互联网技术飞速发展普及,用户接触和处理到的多媒体数据例如图片、视频等成指数级增长,面对海量的数据如何实现快速检索提高检索的精度也变成研究的难点课题,这使得多媒体图像检索技术成为当前的研究热点,在机器学习与计算机应用领域也备受关注。目前利用高效的图像降维算法和适当的相关反馈技术是一种有效的研究途径。本论文主要研究的是LPP降维算法的优化PCA-LPP算法和基于LPP的相关反馈RFLPP算法。目标是得到有效的改进算法以提高降维算法在图像检索中的检索性能。本文主要的研究工作如下:1)对目前基于内容的图像检索中的颜色、纹理特征、形状轮廓、降维算法和相关反馈算法等问题就国内外现状做综述性的分析;2)研究了PCA (Principal Component Analysis)、 LE (Laplacian eigenmap)、 LPP(Locality Preserving Projections)降维算法,将三种降维算法应用于图像检索中,通过对降维时参数的研究和图像检索的效果进行对比实验,分析三种算法的优势和劣势,并在此基础上提出PCA-LPP算法,该算法是将PCA算法与LPP算法的优势结合来实现的,其与PCA算法的考虑全局不同的是以内嵌的局部特征为研究重点,其与LPP算法相比能够考虑非线性局部特征的基础上更好的提高检索的查全率,因此该算法具有对样本点的噪声等因素的十扰不敏感且继承非线性降维算法的特点,通过与其他三种降维算法PCA、 LE, LPP在多媒体图像检索中的实验对比该算法较好的改善了检索性能。3)研究降维算法中的LPP算法与基于神经网络的相关反馈技术结合,提出了LPP的相关反馈—RFLPP算法,其思想是在LPP算法的基础上引入相关反馈技术,进一步提高了检索准确度。利用LPP算法得到降维子空间,在子空间上得出查询数据的k-近邻构成候选数据集,并与查询数据集构建一个权图G,通过弗洛伊德算法求得图G中任意两个数据点之间的测地线距离并排序进而得出反馈结果。本文在Windows7下通过Matlab软件在Corle图像库中进行的仿真实验,实验证明本文所提出的PCA-LPP算法和RFLPP算法取得了较好的检索性能。