基于深度学习的多人姿态估计

来源 :浙江大学 | 被引量 : 0次 | 上传用户:chenyongze
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多人姿态估计是计算机视觉中重要的研究方向,其主要目的是对给定的输入图像或视频,预测其中每一个人身体上各个关键点的位置,以帮助对人的行为进行解读。该任务是动作分类、行人再识别、服饰分析、人机交互等任务的基础,在视频监控、无人商店、自动驾驶、体感游戏、虚拟现实等领域都有着重要的应用价值,对其它类似的关键点预测任务也有一定的借鉴意义。近年来,深度学习尤其是卷积神经网络(Convolutional Neural Networks,CNNs)在图像分类、语义分割、目标检测等计算机视觉领域均取得了突破性的进展,拥有强大学习能力的深度网络越来越受到研究者的青睐。本文针对静态图片和视频中的多人姿态估计这两个密切相关的任务,分别提出了相应的深度学习模型,具体如下:1.对于静态图片中的多人姿态估计,常用的自顶向下的方法在检测框中有多人时,会存在互相干扰的问题。因此本文以特征提取为切入点,提出了一个更鲁棒的自顶向下的网络模型,包括注意力网络和实例分割网络,使网络只关注相关的区域,忽略背景的干扰,从而帮助进行更准确地多人姿态估计。我们通过充分的对比实验验证了上述两个模块网络的有效性,并在COCO这个大型标准数据集上取得了有竞争力的结果。2.至于视频中的多人姿态估计,关键点在时间和空间上的联系可以提供额外的信息来帮助进行姿态估计。因此本文提出了一个自底向上的时空卷积LSTM(Long Short-Term Memory)来优化视频中的多人姿态估计。该框架主要由时间卷积LSTM和空间卷积LSTM组成,并分别结合了光流和关节引力场特征来帮助时空卷积LSTM进行学习。我们在PoseTrack数据集上进行了对比实验,充分验证了提出的方法的有效性,并取得了目前最好的结果。
其他文献
信息化时代的到来使得计算机成为居家必备的良品。在这样的时代背景下,各高校为了能够让学生更为熟悉地操作计算机,相应地开设了计算机基础课程。在计算机的基础教学过程中吗,许
作为北宋一代名相王安石,不仅是政治革新的旗手、思想深邃的大家,更是耳熟能详的文学家。因还家路过仲永家乡,在舅父家听说“世隶耕”的仲永家有5岁神童仲永之趣事,便记挂胸间,并常作探听。当得知仲永“泯然众人”的消息后,作为相天下之事、匡帝业之兴、选贤任能的高官显贵,不禁对天长叹,欣然秉笔,将仲永由神童到众人的变化过程记于字间,传于后世,成为后人努力学习、不断进取的鉴石,谓之意味深长,警示作用不绝于天地间
12日上午,最高人民法院院长周强在十三届全国人大二次会议上作最高人民法院工作报告时表示,要深化司法体制改革和智慧法院建设,推进审判体系和审判能力现代化。发挥司法大数据管
报纸
摘 要:信息技术的普及与发展带动因特网的发展,现阶段,因特网的发展对教育技术的完善起到重要的作用。论文从因特网对现代教育的影响谈起,详细介绍了目前因特网在教育技术中的运用。  关键词:因特网;教育技术;影响  新时代下,因特网、多媒体技术的进步已经使人们的工作、生活和教育方式都出现了很大的改变。传统的人才培养模式所提倡的教育观念、教育方法由于网络和教育的融合而发生着显著变化。正因如此,各国都致力于
在新课程背景下,课程改革、教育模式和方法的更新都体现以人为本的思想,教育思想更新、教学观念转变、德育创新、课程改革、学校个性张扬和特色形成等共同形成以人本关怀为核