基于深度图像和骨骼数据的人体动作识别

来源 :郑州大学 | 被引量 : 0次 | 上传用户:wangshaohua11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉和模式识别中一个非常活跃的领域,并且在自然人机交互、虚拟现实、智能视频监控和多媒体搜索领域中有很多潜在的应用。早期的动作识别算法都是针对彩色摄像机录制的彩色视频序列。随着摄像技术的快速发展,廉价的深度摄像机的诞生,例如微软的Kinect,大大促进了包括动作识别在内的视觉识别技术的发展。和传统的彩色图像相比,深度数据能够提供额外的第三维度的深度信息,该信息不仅对光照的变化不敏感,而且能够忽略由于衣服,皮肤,头发以及背景产生的颜色差异。论文围绕Kinect体感设备获取的深度数据,实现了多种快速且有效的人体动作识别方法,研究内容如下:第一,针对传统的彩色视频序列算法实现复杂,无法做到实时识别动作的问题,论文在骨骼数据的基础上提出了一种实时且有效的人体动作识别算法。该算法提取20个关节点中的15个关键点,然后对15个关键点建模,分别获取它们的位置模型,运动模型以及角度模型,将这些模型进行组合,用HMM模型对动作进行分类。在微软的权威数据库MSR Action3D进行实验,实验结果表明,该算法能够做到实时且识别率较高并且能够在处理深度骨骼视频时能做到实时识别。第二,针对传统的彩色视频二维信息不足导致动作识别效果不佳的问题,提出一种新的基于三维深度图像序列的动作识别方法。该算法在时间维度上提取了时间深度运动图(TDMM)来描述动作。在三个正交的笛卡尔平面上,将深度图像序列分成几个子动作,对所有子动作作帧间差分并累积能量,形成深度运动图来描述动作的动态特征。最后用支持向量机(SVM)进行动作的分类。在两个权威数据库MSR Action3D和MSRGesture3D上进行实验验证,实验结果表明,该方法能够快速对深度图像序列进行计算并取得较高的识别率,并满足深度视频序列的实时性要求。第三,在时间深度运动图(TDMM)的基础上,提出了时间深度模型(TDM),在空间维度上,用空间金字塔方向梯度直方图(SPHOG)对时间深度模型进行编码得到一种全新的描述符,即TDM-SPHOG描述符。用SVM和CRC进行动作的分类。在相同的数据库MSR Action3D和MSRGesture3D上进行实验验证,实验结果表明,该方法能够得到非常高的识别率。本文提出的针对深度数据的方法同现有的主流方法相比,在识别率上都有着很大的提升,同时在速度上基本都达到的实时性的要求,足以证明这些方法的有效性。
其他文献
通过论述国内外信道探测技术的研究现状和比较几种常见探测方法的优劣,依据矿井通信的发展需求,并借助地震波勘探理论,论文深入讨论了低频弹性波在大地媒质中的传播规律,结合
随着工业4.0时代的到来和智能工厂的发展方向,工业机器人控制系统已经朝着开放式、嵌入式、低成本、高速率、重载的方向发展,而工业以太网因其速度快、数据容量大、实时性强
无线Mesh网络(WirelessMeshNetworks,WMNs)由于具备低控制开销和高容量等特性已受到业界的广泛关注,其骨干Mesh路由节点准静止、能量无约束等独有特征使得网络在增加整体容量
时域反射仪(TDR)现在常用来研究土壤的介电特性。介电常数和电导率是反映土壤介电特性的两个重要参数,介电常数反映储存于材料中能量的程度,电导率是反映了电荷在电场作用下的
学位
随着无线设备及相关应用的快速发展,传统无线网接入、传输协议已无法适应这一趋势。其中,最主要的挑战包括如下几个方面:1、频谱资源已分配殆尽;2、已分配的频谱资源使用率极
随着因特网以及数字多媒体技术的迅猛发展,人们对数据传输的速度提出了新的要求。图像数据在存储及传输过程中占用了大量带宽资源,因此图像压缩技术就显得尤为重要。FPGA是实
近几年来,智能交通管理系统成为众多学者研究的热点。车牌识别系统作为智能交通系统的一个重要组成部分,应用范围广泛。本文针对车牌识别系统的三个部分做了如下工作:车牌定
笔迹作为人的一种常见行为特征,越来越多地被应用于生物识别中。计算机笔迹鉴别经历了半个世纪的发展取得了一定的成就,但是鉴于笔迹鉴别自身的特点,现阶段通过改进某种单一方法
学位
随着信息技术的发展,下一代接入网致力于以高效的方式为大量用户同时提供多重宽带服务。波分复用无源光网络WDM-PON (Wavelength Division Multiplexing Passive Optical Net
随着无线技术的进步,以及传感器技术和嵌入式系统的发展,无线传感器网络开始进入人们的日常生活,并发挥越来越重要的作用。由于医疗领域和人们对可穿戴式服务的需求,对WBAN网