论文部分内容阅读
随着经济社会和互联网技术的迅猛发展,数字媒体技术日新月异,计算机视觉领域发生着翻天覆地的变化,智能信息得到广泛应用和发展,与此同时伴随而来的是海量图像数据。面对庞大的图像资源,如何从中精确、快速地检索出用户感兴趣的图像信息成为一个极具现实意义和理论价值的课题。大规模人脸图像检索作为其中一个具体应用,具有重要的研究价值。由于实验条件的限制,本课题针对含有20万人脸图像的大规模数据进行相关设计和实验。在此研究基础上,本系统可以推广到更大规模的人脸图像检索。大规模人脸图像检索系统的目标是给定一张待检索的人脸图像,从大规模人脸图像数据库中查找出与待检索图像具有相同或者相似特征的人脸图像。检索系统的效果与人脸图像特征编码的质量和索引的设计等有着很大的关系。传统的人脸图像检索系统在特征编码、检索速度和精度等方面效果不理想,特征编码向量的维度较高,占用很大的内存空间,往往会引起―维度灾难‖;随着图像规模的增加,人脸图像的检索速度等明显下降。针对以上不足以及结合实验室项目需求,本人对大规模人脸图像检索相关知识进行调研和学习,最终完成了大规模人脸图像检索系统的设计和实现。相比之前的系统,本系统在以下方面得到了改善:图像编码会占用较少的内存空间,图像检索效果在多参照重排操作下得到更好的保证。本文主要内容如下:1.人脸图像特征编码。对提取的局部特征向量进行编码,方便人脸图像相似度的计算以及内存空间的有效利用。在本文中采用了改进的VLAD方法对提取的特征向量进行聚合,使得生成的聚合描述符具有更强的降维能力以及更好的查询性能,然后在此基础上完成向量的积量化编码。2.人脸图像检索。在检索过程中,首先采用非对称距离计算倒排索引技术对编码向量建立倒排索引表,利用局部特征检索出候选人脸图像。此时的图像具有较低的精度,然后采用全局特征通过多参照重排技术对候选人脸图像进行再次筛选,进一步提高人脸图像检索效果。