基于深度卷积神经网络的人体姿态估计

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:kenmaxabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,计算机视觉、自然语言处理、语音识别等新兴技术也正在快速发展着。作为计算机视觉领域中的前沿研究方向,人体动作行为识别在视频监控、人机交互、虚拟现实和视频检索等方面都有着非常广泛的应用。深度卷积神经网络(Deep Convolutional Neural Network,DCNN)是一种深度学习模型,常用来处理和分析视觉图像。本文在Mask R-CNN框架下,结合狄拉克网络(Dirac Nets)的深层次特征提取能力,引入细节保留池化(Detail-preserving Pooling,DPP)操作,设计特征提取网络。然后,结合积分姿势回归的避免量化误差的优势,引入Ranger优化器和Mish激活函数进行算法优化,设计人体姿态估计模型。本文完成的主要工作如下:首先,构建了基于狄拉克网络和细节保留池化的人体姿态估计模型(DDHPE)。通过分析狄拉克网络的原理和结构,引入了具有自主学习能力的狄拉克网络作为特征提取网络。在此基础上,针对一般池化层容易忽略细节特征的问题,利用能够放大空间变化的细节保留池化操作对特征提取网络进一步优化。将优化后的特征提取网络和特征金字塔网络作为Mask R-CNN的骨干网络,提出了具有深层次特征提取能力的人体姿态估计模型DDHPE。在CIFAR-10和CIFAR-100数据集上验证了特征提取网络的有效性。在MSCOCO2014数据集和MPII数据集上的实验结果表明,所构建的人体姿态估计模型可以提升预测的精确度。然后,提出了人体姿态估计模型DDHPE的优化算法。针对人体姿态估计任务,引入可以避免量化误差的积分姿势回归来优化基于狄拉克网络和细节保留池化的人体姿态估计模型,构建了基于积分姿势回归的DDHPE模型(IPR-DDHPE)。此外,利用能够优化网络梯度传播的Ranger优化器和优化网络结构的Mish激活函数对IPR-DDHPE模型进一步优化。在MSCOCO2014数据集和MPII数据集上的实验结果表明,优化后的RM-IPR-DDHPE模型提升了人体姿态估计的精确度。最后,设计并实现了人体姿态估计原型系统。将人体姿态估计任务应用在视频检测中,以视频数据集Human3.6m为处理对象,在Django的应用框架下设计出人体关键点检测演示系统。该原型系统通过对视频中的每一秒进行检测,实现了对目标人物的检测,并在此基础上进行了人体姿态关键点的估计。该论文有图27幅,表9个,参考文献92篇。
其他文献
培养应用型创新人才是高职教育的重要任务,而创新思维是创新人才的核心要素。教学决策决定教学效果,高职院校教师在教学理念、教学计划、教学目标、教学模式、教学内容等决策上
城市居民是城市生活的主力军,他们的低碳意识与低碳行为将在一定程度上直接影响城市区域碳减排的成效,而社会分层的客观存在,决定了社区居民的社会经济地位与其低碳行为及态
邮市上出现伪造的“上海新世界月刊社”大宗交寄名址签,所盖“国内邮资已付”和“汽车行动邮局”两戳,都是仿制的,文字与线条都不似钢质戳具印迹,而且背面没有粘贴的痕迹。
在对企业效率问题分析的基础上,提出了一套基于DEA方法的企业效率评价模型和评估指标体系,然后选择包括武汉钢铁、上海宝钢、莱芜钢铁等15个钢铁企业的实况进行企业效率评价测
长瓣兜兰(2001-18-2)产自我国,分布于云南东南部和广西,1940年被我国植物学家唐进和汪发瓒发现,最大特征是花瓣呈带状,长8—12厘米,宽约7厘米,扭曲下垂。世界语出版社1987年版《兰
<正> 麦积山位于甘肃天水秦岭山脉西端,遥望山体如堆积的麦垛(题图)。石窟始凿于后秦年间,距今已有1600多年,其后各代都有修造,现为全国重点文物保护单位。这些石窟开凿在陡
<正>一、课题的提出(一)研究背景:1、社会发展的需要。高中政治课堂教学生活化符合当今社会发展趋势,是一种十分有效的教育策略,有助于学生素质的全面提高,在教育中具有十分
会议
依托网络技术开展实验教学,可采用课件模拟、模拟器开发、仿真实验室等网络模拟实验模式。为适应网络模式下的实验教学,应重新定位培养目标。突出学生信息能力、协作能力、自
随着社会的发展,建筑行业得到了较好的发展,城市化的进程加快,带动了城市道路的建设,本文针对隧道施工的工作进行探究,针对其施工控制工作的要点和处理措施进行深入的探究,希