论文部分内容阅读
在大型商场、游乐园等人口密集的公共场所,经常需要从监控视频得到的图像中来查找一些特殊身份的人,然而由于行人与摄像头之间的距离较远以及摄像头分辨率有限等原因常常会得到低分辨率的人脸图像,而低分辨率人脸图像包含信息量比较少,同时伴随着姿态、表情、光照等因素使得提取有效的人脸特征较为困难,这增加了人脸识别的难度。本文主要研究了低分辨率人脸图像的人脸验证工作,即已知一张高分辨率人脸图像基准和一张低分辨率测试样本图像来比较两者是否是同一个人。论文的主要工作有以下三个方面:(1)本文使用卷积神经网络来提取人脸的特征,得益于卷积神经网络的深度架构和强大的自主学习能力,相比于人为定义的特征,卷积神经网络有能力从多层的非线性映射中提取出有效的人脸特征来代表此人的身份信息。(2)借鉴超分辨率重建的思想,使用卷积神经网络来处理低分辨率测试人脸图像,使得处理后的人脸图像有更多的有利于识别的高频信息,之后继续使用卷积神经网络来提取人脸的特征,增强人脸特征的网络和提取特征的网络同在一个卷积神经网络之中,达到了端到端的效果,所有参数可以一起调节,避免了只过度优化某一步骤的现象,有利于得到全局最优解。(3)将高分辨率人脸基准图像和低分辨率测试样本映射到一个统一的特征空间来解决两者特征维数不匹配的问题,本文使用两个卷积神经网络来分别提取特征,除了两个网络因输入图像的分辨率不同而使得各层的特征映射分辨率不同之外,两个网络提取特征的网络层的结构相同,使得两个网络提取到的特征尽量相同。另外提取低分辨率测试样本特征的网络比提取高分辨率人脸基准特征的网络多三层,这三层是为了增加低分辨率测试样本的高频信息。网络的全连接层是提取到的人脸特征,两个网络输入图像的分辨率不同,但全连接层神经元的个数保持相同,使得两个网络提取到的人脸特征维数相同,统一了高分辨率人脸基准和低分辨率测试样本的特征空间,卷积神经网络基于加州伯克利大学的深度学习框架caffe实现。利用两个卷积网络分别提取到高分辨率人脸基准和低分辨率测试样本的特征后使用联合贝叶斯来计算两者的距离校验两张人脸是否属于同一个人。