论文部分内容阅读
随着虚拟现实、机器人、人工智能等技术的迅猛发展,基于人体的多元化交互方式正成为人机交互新的发展方向。人手能够传递丰富的交互信息,使得基于人手的交互技术逐渐成为研究热点,同时对于人手运动跟踪技术研究的需求也日益迫切,然而人手的高自由度结构及运动的灵活性使该技术容易受到自遮挡、自交叉等问题的限制。本文针对基于单目深度图像的人手运动姿态参数求解技术,开展了无标记实时人手运动跟踪技术研究,设计了基于表观和模型混合方法的人手运动跟踪算法,该算法解决了复杂背景下兴趣区域提取适用范围小、动作受限的问题,改善了模型拟合技术中因早熟收敛、局部最优导致的低精度问题。本文的方法达到较高的图像分割精度,基于混合方法的跟踪技术也可以取得一定效果。主要研究内容如下:首先,针对复杂背景下单目深度图像兴趣区域提取问题,研究了基于随机森林分类器的人手图像分割算法。其次,结合阈值分割方法的特点,引入一个基于人手质心点深度的差分特征。然后,以手势分类为目的,改进基于深度图像特征提取算法,使该算法能够尽可能缩小不同使用范围、场景之间人手和背景的深度差异。最后,利用中值滤波和形态学开运算去除传感器噪声,填充孔洞。实验结果表明,本文提出的方法相比于现有的方法更易于实现,对未知样本的具有较强的泛化能力。针对基于表观的重初始化问题,在判别式跟踪方法的基础上,研究了基于随机森林分类器的手势分类方法。首先,在三维模型建立的基础上,利用Ogre图像渲染引擎,研究了模型的正向驱动及参数反向推算方法。然后,根据深度传感器的精度,设计了精度逼近的合成深度图生成方法。接着,以手势分类为目的,在深度差分特征的基础上,对特征提取算法进行了改进。最后,实现了基于信息增益及分布直方图的随机森林算法,并在模拟数据及真实深度图像上验证了算法的有效性。针对基于粒子群优化算法的模型拟合技术开展了研究。首先,对粒子群优化算法进行分析,采用标准的粒子进化方法,其次,为了能够对预测参数进行精确评估,考虑到模型深度与图像分辨率之间的透视关系,设计了基于摄像机定焦的渲染图像归一化方法。针对计算效率问题,设计了基于CUDA的PSO并行计算方法,实现了 Ogre与CUDA的混合编程技术。为了验证本文中提出的跟踪算法的有效性和可行性,针对单手运动跟踪开展了无标记实时人手跟踪的实验研究,得到了能够达到预期目标的实验结果,验证了本文中跟踪算法的有效性。