基于深度学习的人脸活体检测算法研究

来源 :江南大学 | 被引量 : 1次 | 上传用户:zn19861225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断发展,各种以生物特征为基础的身份鉴别技术已经逐步民用化、商业化,指纹解锁、虹膜打卡和人脸支付等新型身份认证技术已与人们的生活息息相关。人脸识别技术凭借其无接触、生物特征明显和容易获取等优势而成为当前主流的生物特征识别方法,带来了巨大的社会效益和经济效益,但是另一方面,人脸识别系统遭到攻击的案例也让其安全问题受到重视。在人脸识别系统中,攻击者可以通过伪造用户的面部信息进行攻击,比如通过打印人脸照片或播放人脸视频等手段伪造用户的面部信息,从而骗过人脸识别系统,因此将人脸活体检测模块引入到人脸识别系统中,对保证人脸识别系统的安全具有重要意义。但是,由于人脸欺诈手段具有多样性,以及真实人脸与欺诈人脸之间具有很强的相似性,传统手工提取特征的方法难以将两者直接区分开来。欺诈信息表征的质量将直接影响到后续分类的效果,因此如何有效的表征原始图像,提取合适的特征并加以合理利用,是人脸活体检测领域的一个关键问题。深度学习方法的出现以及在计算机视觉领域的广泛应用,展示了其良好的图像特征提取能力,使得基于深度学习的模型成为人脸活体检测领域中的研究热点。因此,本文将以深度学习为基础,对基于深度学习的人脸活体检测技术进行了进一步的研究,以达到提取有效特征、降低系统错误率的目的。本文针对打印攻击和视频重放攻击这两种欺诈方式展开课题的研究,深入分析了基于深度学习的人脸活体检测方法以及相关改进算法,分别从多维信息利用、样本扩充和模拟标签生成等几个方面展开了研究,在此基础上,提出了三种基于深度学习的人脸活体检测的改进方法,具体内容如下:(1)提出了一种结合混合池化的双流活体检测网络。该方法首先对数据集进行光流提取,用以表示数据集中的时间维度信息。其次,设计了空间金字塔和全局平均结合的混合池化模块,可以对特征信息进行多尺度的学习,并能够减少网络中的可学习参数,一定程度上缓解过拟合问题。最后,通过对时间维度的结果和空间维度的结果进行加权融合,达到充分利用时间和空间特征的效果,进而提高了对真实人脸和攻击人脸的识别效果。(2)提出了利用局部和深度信息的活体检测网络。首先,对数据集进行分块处理,提取数据集中的局部信息,同时该操作在一定程度上起到扩充数据集大小的效果。其次,为了引导网络学习到更加有效的特征,引入深度信息对网络进行辅助监督,并结合结构相似性损失来学习到更加真实的深度信息,该深度信息可以提取数据集中的全局信息。最终,通过对局部信息和全局信息进行加权融合,实现对局部信息和全局信息的充分利用,提高了对真实人脸和攻击人脸的识别效果。(3)提出了基于图像转换的活体检测网络。首先,通过三维人脸模型对数据集生成模拟的深度标签。其次,结合生成的深度标签,并利用生成对抗网络训练得到高质量的生成模型,将RGB图像转换到深度图像。最终,利用生成对抗网络的隐含层特征进行训练得到分类器,达到利用深度信息的目的。由于深度信息具有较强的区分性,因此模型在未知场景下的泛化能力也有所提高。上述的方法均在CASIA-FASD和Replay-Attack等公开数据集上进行了对比实验,通过比较不同的评价指标,验证了本文方法的有效性。实验结果表明,与经典方法相比本文的方法具有一定的竞争力。
其他文献
特定目标情感分类是自然语言处理的重要研究方向之一,其旨在准确判别句子中目标实体的情感极性,由于目标实体的情感极性依赖于句子上下文语境中某些表达目标情感的情感特征词,通过挖掘目标实体与句子上下文的语义情感联系,从而找到与目标实体相关的情感特征词;虽然特定目标情感分类模型在过去的几十年研究中已经有了极大的发展,但仍存在无法充分挖掘目标实体与情感特征词的关联,以及准确判别包含多个目标的句子中的目标情感极
将同一个场景下的不同模态传感器得到的图像进行融合,得到一张包含多源信息的融合图像,此类任务称为图像融合任务。其中红外图像与可见光图像融合是一个重要的课题。红外图像可以根据热辐射的差异将目标与背景区分开来,在白天或者黑夜的所有时间和各种天气条件下,红外图像都能很好地发挥作用。相反,可见光图像可以以与人类视觉系统一致的方式提供具有高空间分辨率和清晰度的纹理细节。图像融合领域如今已经有了大量成熟的方法,
在一些化工间歇如注塑机注塑速度控制过程中,通常需要在有限的运行时间内执行一些重复性操作,近年来如何利用系统重复运行的信息改善系统性能的控制问题引起了广泛关注。迭代学习控制是有效解决此类控制问题的方法之一,其关键思想是通过先前批次的误差信息不断优化控制输入从而实现高精度跟踪的控制目的。针对实际生产中常见的状态时滞系统,本文进一步考虑系统运行中存在的不确定性对跟踪性能的影响,通过建立状态时滞不确定模型
在智慧博物馆建设的背景下,物联网、大数据、云计算、移动互联网和人工智能技术为博物馆文化资源的开发、传播、保护和管理提供了技术支持和更多的方法。博物馆不仅承担着文化展示的作用,也发挥着对观众的教育职能,以丰富的馆藏文化资源和开放式的展示环境,对儿童教育起到了举足轻重的作用。特别是博物馆多样化的教育形式、内容和展示方式,带给儿童在多维视角上的文化认识和文化体验方式的变化。本文从体验设计的角度,探索如何
随着机动车日益增加,环境污染、交通拥堵、交通事故是当今乃至以后世界各国发展路上所需要面临的难题。作为解决此难题的重要方法之一,智能交通系统登上了历史的舞台。作为智能交通系统的重要研究内容,多自主车辆队列的优点在于可以有效降低油耗、提升乘客的乘坐体验、增加道路通行量等,这些优点让多自主车辆队列正逐渐成为控制领域及交通领域的研究热点。其目的是在保证安全的前提下,通过车载传感器、车与车通信以及控制算法让
民族服饰折射一个民族的文化,同时也是宝贵的文化遗产。满族的民族服饰文化极具民族色彩,有着很高的文化价值。对于这些传统工艺美术资源,如何能够挖掘其文化内涵并进行保护与传承,并在当代语境及社会背景下重新焕发出生命力,从而让更多人真正了解和喜爱优秀传统文化,是值得深入探究的课题。在本文的研究中以满族服饰的装饰语言作为研究中心,同时进行文献研读与实地调研,以其做为研究基础,灵活运用历史资料研究法、文献剖析
不平衡数据的分类问题一直是机器学习与数据挖掘的共同课题。在传统的学习过程中,分类器大多在不平衡比例接近1的数据集上进行分类研究。然而在实际应用中,数据集的不平衡比例往往较大,分类器为了降低判别损失率,在分类过程中就会偏向多数类样本,从而影响分类结果。随着研究的不断深入,许多针对不平衡数据的算法被提出,有效降低了数据不平衡性对分类器性能的影响。本文从数据层面的算法入手,对不平衡数据的分类问题进行研究
卷积神经网络(Convolutional Neural Network,CNN)在图像特征学习领域取得卓越的成就,已经成为解决图像分类、图像降噪、目标识别、图像分割以及其它充满挑战的计算机视觉任务的主流方法。从将网络层简单相连的逐层连接的网络结构,到支持跨层间连接结构的残差网络结构(Res Net),到密集连接的密集网络结构(Dense Net),再到Google Net宽度网络结构,网络结构已经
大数据时代的到来,涌现出大量蕴含丰富语义信息的非结构化文本数据。为了应对海量数据的挑战,关系提取与知识图谱成为自然语言处理领域的重要研究话题。通过关系提取辅助知识图谱的构建,从而实现海量数据的重构,具有重要的现实意义。本文针对关系提取网络中存在的不足,进行了相关研究工作。第一,由于句子结构复杂多样,现有的关系提取网络抽取句子特征的能力明显不足,因此,在特征抽取阶段如何充分学习句子中潜在的关系特征是
随着电子商务的快速发展,为了降低成本,商家将物流业务转交给第三方物流(3PL)公司进行服务。然而随着物流市场的不断拓展,3PL逐渐展现出局限性,存在服务项目单一、信息化程度不高、企业间缺乏合作等问题,难以实现社会资源的优化配置。针对这些不足,第四方物流(4PL)应运而生,它通过整合3PL物流资源,进而满足了复杂的实际运输需求。4PL是一种崭新的物流运作模式,如何利用4PL的资源整合能力降低成本、碳