论文部分内容阅读
随着互联网搜索引擎日趋多元化,用户已经习惯于在互联网上借助各类搜索引擎搜索各种信息,包括文本、图像和视频等。传统的基于文本的图像检索系统,大都依赖关键字搜索。由于文本信息的描述内容与图像本身不匹配和图像所包含的大量噪声,导致搜索结果词不达意。现有主流的互联网搜索引擎,如Google、Bing、百度等进行相关的图像搜索时,主要利用图像周遭的相关文本信息来对图像列表进行搜索和排序,缺乏考虑图像间内在的联系和图像自身的内容,导致基于文本的图像搜索结果不尽如人意。如何将符合用户所需的图像排在搜索结果中靠前的位置,提高图像相关搜索结果的质量,已经得到了众多研究者的关注。图像重排序是指在基于初始搜索结果的前提下,挖掘图像间内在的联系和图像自身的内容,对初始排序结果重新进行排序,将符合用户所需的图像排在靠前的位置。目前,根据使用框架的不同,图像重排序方法大体可以分为四类:基于线性组合的重排序、基于聚类的重排序、基于分类的重排序和基于图理论的重排序。现有基于图理论的重排序方法一般对初始排序结果的得分采用伪相关方法,默认靠前的图像得分高,但事实并非如此。由于搜索引擎返回的初始排序的结果列表是基于文本检索所得,其结果列表精度不高,可能会导致靠后的图像更符合用户所需。基于上述问题,本文提出了两种基于图理论的多模态图像重排序算法,主要工作和创新点如下:1.为了提高图像检索中的重排序效果,提出了一种基于图理论的多模态随机游走重排序算法。现有的重排序算法大都根据检索返回的图像顺序来设置图像列表得分序列初值,与此不同的是,本文所提算法将多模态概念融合应用于随机游走算法中,由此避免了单一模态获取图像内容所造成的片面性,进而利用多模态随机游走方法对返回图像列表的得分序列进行初始化,然后利用多模态重排序算法最优化目标函数,并对相关参数和得分列表进行迭代更新,从而获得最终重排序后的图像序列。实验显示了本文所提出的基于图理论的多模态随机游走重排序算法具有良好的重排序效果。2.为更加真实地反映图像重排序的意图,并使多模态在重排序算法中更加有效,提出了一种基于图理论的多模态相似性积分重排序算法。该算法首先将返回的图像集生成六种模态,并将多模态概念应用到相似性积分算法中。进而将相似性积分算法返回的图像排序得分列表作为基于图的多模态重排序算法的输入。在得到排序结果后,将利用标准拉普拉斯正则化生成重排序算法的目标函数最小化。然后对相关参数和得分列表进行迭代更新,最终获得重排序后的图像序列。实验表明文中所提出的重排序算法的排序效果良好,验证了基于图理论的多模态相似性积分重排序算法的有效性。