基于8bit量化神经网络的人脸检测识别算法设计与FPGA验证

来源 :东南大学 | 被引量 : 0次 | 上传用户:xxuhhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测识别技术操作友好用途广泛,已经成为社会生活中最重要的生物特征识别技术之一,基于深度卷积神经网络的人脸检测识别方法相较传统方法拥有更好的准确性和可扩展性,但其存储、传输与计算的成本也更高。使用数值量化方法可以降低深度卷积神经网络的运行成本,配合针对优化的硬件设计,能在有限的资源下实现较高的处理速度,若能在量化的同时保持检测识别的准确性,即有望实现高效的终端人脸检测识别系统,为智慧城市、智能物联网等下一代应用场景补上技术上的关键一环。本文首先总结了人脸检测、人脸识别、神经网络量化与硬件加速的代表性方法。然后,优化DoReFa-Net算法改变量化数据分布形式,提高量化模型的存储空间利用率,经测试,在8-bit量化精度下,可保持模型准确率且获得较高的压缩率和加速效果。基于YOLO算法设计端到端的8-bit量化人脸检测网络,在提升检测速度的同时也能取得较高的准确率。基于CenterFace算法设计低类内距离高类间距离的8-bit量化人脸识别网络,使误识更少,识别类别可扩展性更强。在此基础上,通过多层次的并行计算扩展和数据复用优化,实现了低带宽需求、高吞吐率以及高资源利用率的通用卷积神经网络加速器。最后,将8-bit量化人脸检测识别网络和硬件加速器进行结合,并在FPGA开发平台上完成验证。本文设计的8-bit量化人脸检测网络在人脸检测数据集FDDB上取得了93.91%的准确率,8-bit量化人脸识别网络在人脸识别数据集LFW上取得了94.23%的准确率,二者的准确率量化损失均小于1%。以量化人脸检测识别网络为基础,时钟频率为100 MHz时,设计的卷积神经网络加速器在Zynq XC7Z035 FPGA芯片上的有效算力可达125 GOPS,计算单元平均利用率超过80%。设计了终端人脸检测识别系统并在MIZ-7035开发板上进行了实测验证。本文的研究可以为后续高准确率或高处理速度的人脸检测识别硬件加速研究提供一定的经验参考。
其他文献
乡土建筑是建筑遗产的一个重要分支,其保护工作一直是学术界研究的重点。我国幅员辽阔、历史悠久,曾经辉煌的农耕文明孕育了数以万计的传统乡村和风格多样的乡土建筑。乡土建
在西方管弦乐队中,双管编制是常用的形式之一。从历史的角度入手,探究这一重要的乐队编制如何在古典主义前期萌芽、确立和发展的,继而探究它形成的原因。
第一部分:NLRP3炎症小体在脓毒症相关性脑病小鼠认知功能损伤中的作用目的脓毒症相关性脑病(sepsis-associated encephalopathy,SAE)是ICU脓毒症患者中枢神经系统常见的并发症,患者常伴有认知功能损伤和精神障碍,SAE可增加患者死亡率并且加重家庭和社会负担。目前,SAE是重症医学和神经科学广泛关注的焦点,然而其机制尚不完全清楚。核苷酸结合寡聚化结构域(Nod)样受体
休闲游带动旅游消费结构变化、景区旅游要向全域旅游转变,旅游业已经成为我国国民经济和现代服务业发展的重要驱动力,许多政府、数据企业和互联网服务提供商开始积极合作、数据共享、研发和打造智慧旅游系统平台,数字信息技术越来越成为旅游行业研究与市场运行的重要支撑。手机移动信令数据是在大数据时代背景下一种新的时空行为数据来源,本文以脱敏后的手机信令数据为基础,建立旅游者时空轨迹数据库,在社会网络分析的框架下,