自然场景下多姿态人脸识别的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xiaoyawxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在新冠疫情防控期间,人脸识别在病毒流调、无接触通行、目标追踪等方面发挥出重要作用,但此类复杂的自然场景伴有诸多干扰因素,阻碍了识别性能的进一步提升。本文将研究在自然场景下如何改善跨姿态人脸识别任务的表现。该问题面临如下挑战:(1)相比于光照、表情等因素,姿态变化更容易引起自遮挡和外观扭曲等问题,使得原本处于人脸中心区域的显著特征有所缺失,进而发生一种现象:相比于类间差异(即不同对象之间的特征差异),类内差异(即同一对象的不同图像实例之间的差异)却更明显,最终严重影响模型的识别性能。(2)当下,数据集的客观矛盾也制约着传统算法和以数据驱动的深度学习算法的进一步突破,即:(1)正脸与非正脸成对标记(属于同一对象)的配对数据几乎来自受限数据集,并且此类数据集存在多样性(即对象数量)不足、数据体量较小以及姿态变化不够丰富等问题;(2)而公开的非受限数据集恰巧相反,在多样性、数据量、变化因素等方面有着天然优势,但缺乏足量的配对数据;(3)此外,数据集内的姿态分布通常是极度不平衡的,此类数据域的分布特征有碍于泛化能力的提升。本文将直面以上挑战,以循环一致思想为基础,针对人脸正面化任务而改进CycleGAN,在模型框架、网络结构、学习策略以及损失函数等方面作出调整,使得原本不擅长处理较大几何变换的CycleGAN能够用于人脸姿态变换,最终得到一种基于循环一致对抗网络的半监督人脸正面化模型。受限环境和自然场景下的定性和定量结果显示,该方法能够有效提升多姿态人脸识别的性能,概括地,其贡献和创新如下:(1)框架中,改变判别器组与生成器组的独立对抗关系,而构建新的一对多的轮流对抗关系;并重新设计子模块的网络结构,融入姿态估计信号和局部注意力机制;目的是学习姿态变换、提升输出图像质量,并削弱模型训练的不稳定性。(2)在学习方式上,将无监督调整一种更具泛化能力且统一的半监督策略,充分利用了配对和非配对数据的各自优势,使得模型能够适应更广泛的现实场景;且训练集配置更重视较大偏航角和俯仰角同时存在的图像实例,而其他代表性方法几乎只关注偏航角一个维度。(3)为了进一步克服姿态旋转的内在不确定性,原始框架的损失函数不尽适用;因此,集成了像素级、感知层等维度的约束,并设计了一个新的姿态偏移角损失;以此增强非监督分量的循环一致性和姿态一致性。(4)以此模型为核心依赖,实现了一套小型的多姿态人脸识别系统。
其他文献
近年来物联网迅速发展,物联网终端规模迅速扩大。然而对大量物联网终端的电池进行更换,需要高昂的维护成本。因而终端的功耗成为限制物联网长期大规模部署的主要因素之一。终端功耗居高不下的原因在于通信与计算的功耗。为降低物联网终端功耗,近几十年来出现了环境反向散射通信技术已经能将终端的通信功耗从mW级降至以W级。其中Wi-Fi反向散射通信系统,因可以借助现有Wi-Fi设备部署,具有易部署的优点。然而现有的W
近年来物联网取得了快速的发展,如何为大量的物联网设备供能成为了当今物联网领域急需解决的关键问题之一。由于具有体积小,寿命长,免维护的优势,使用环境能量采集技术的无源系统在物联网中得到广泛应用。但是,由于能量短缺以及能量采集功率与计算功率不匹配的原因,无源计算系统目前在实际应用中仍然受到较高的任务响应时间的困扰。如果能够进行合理改造使其满足实时计算对于响应时间的要求,无源系统就可以快速响应网关,获得
近年来,随着人工智能技术的飞速发展与我国人口老龄化进程的加快,机器人已经逐渐被应用于各个领域,尤其是一些从事简单工作的劳动力行业。房屋装修作为房地产相关服务的重要组成部分,装修质量和周期至关重要。同时,随着生活质量的高和国家对未来绿色建筑的倡导,人们对房屋装修的要求越来越高。在此背景下我国房屋装修行业逐渐向机械化、专业化、智能化方向转变。随着数据获取技术的发展,语义分割对象已经由二维图像转向体素、
作为区块链2.0时代的重要标志,智能合约具有数据透明、不可篡改、永久运行等特点,这就使得其在解决“信用”问题方面具有天然的优势,近几年来智能合约的数量和规模也在不断扩大,并且功能也日益复杂。但因智能合约的编写和传统软件的编写存在一定的相似性,所以智能合约也不可避免地存在漏洞。智能合约很容易遭到黑客攻击,因为它们很难修补,并且缺乏确保其质量的评估标准,黑客可以在以太坊上发布智能合约中的漏洞,几年前的
视频图像数据维度高、流量大、传输带宽受限,尤其在5G时代下,对高效高性能的编码提出了挑战。如何提升高清视频编码过程中图像的传输质量并确保高效压缩效率,如何尽可能地通过率-失真优化技术平衡码率与失真从而抉择更好的预测模式获得更好的编码性能,都是视频编码研究的关键问题。在问题驱动下,本文分析并建立了时域冗余模型,分别给出了图像级、块级的率-失真优化策略。具体工作分为三个方面。(1)针对编码中占比最大的
随着比特币而出现的区块链技术对传统的中心化服务理念产生了极大的冲击,导致客户更愿意青睐并非一家独大的运营模式。但是数据的去中心化和服务的可维护性却是反比的关系,位于此种关系两种极端情况下的公有区块链和私有区块链由于各自的缺点,导致其很难适应现如今的商业运行模式。联盟链的诞生结合以上两种区块链运行模式的优点,进一步克制各自的缺点,成为时下各大商业化区块链的首选。目前联盟链的日常运行完全依赖于管理员节
作为众多自然语言处理任务的基础,词语的语义表征和学习成为了近年来的研究热点。最初的大量研究成果都是针对英语,德语等符号形语言,而中文作为象形文字具有其独特的特点。于是一些中文研究者利用中文词语中字,偏旁部首,部件构造等细粒度特征对中文语义表征算法进行了优化,使得词语的语义表征在中文自然语言处理任务中效果更好。然而,这些现有中文语义表征的算法仅仅关注于词语内部原始的特征,没有深度挖掘出词语-词语之间
随着移动终端的发展,智能手机以它强大的功能吸引了非常庞大的用户,其中Android系统因为其开源、自由的特性深受开发人员的喜爱,占据了很大的市场份额,但这也为安卓恶意软件敞开了大门,所以研究一个有效的恶意软件检测方法非常有必要。目前通过流量分析来检测恶意代码的研究并不多,常见的Android恶意软件识别与分类方法多是基于静态程序分析,通过分析Android软件的API调用、权限等特征来识别和分类。
近年来,微电子和低功耗的技术发展助力了物联网系统的进步,计算密集型应用出现爆炸式增长,如无人驾驶、增强现实等,这要求网络基础设施能够提供更低的时延和更强的计算能力。多项研究表明,边缘计算是必不可少且极具前景的解决方案。边缘计算提出崭新的云-边-端架构,在离终端设备更近的地方部署服务器,从而显著减少了用户时延、网络带宽压力和云计算中心存储计算压力。在边缘计算系统架构中,有许多工作研究了静态边缘机制,
径流时间序列是一种具有代表性的时间序列,对其进行相关分析研究已有很多先例,并取得了不错的结果。然而径流时间序列受到多种复杂因素综合影响,使用传统方法不足以分析其中含有的丰富信息,而且也不能进行高效精准的预测,但是径流又对生产生活具有重大影响。所以,对于提升径流预测精度,需要引入新的预测方法、改善预测流程、提高模型预测能力迫在眉睫。本文在对某流域的河段站点上,选取有代表性的位于该流域上下游的A、B两