论文部分内容阅读
手语识别的研究始于20世纪80年代,它涉及模式识别、图像处理、计算机技术等多门学科。手语是聋哑人之间进行交流沟通的语言,是同自然语言并行的一门语言,手语识别的目的是方便正常人和聋哑人之间进行无障碍沟通,使聋哑人更好的融入社会生活,因而具有非常实际的应用价值,同时手语识别应用了最新的科学技术和理论成果,具有重要的理论价值。由于手是弹性物体,同一种手语之间的差别很大,同时手的表面是非光滑的,所以在采集手势时会产生不同程度的阴影。这些因素给手势识别的研究带来了很多影响。本文基于静态手语图像,重点研究了复杂背景下手势区域的提取、手势库的建立、手势图像预处理、特征提取和识别。本文首先自行建立了手势语的模板库,然后利用肤色聚类的特性,提出了在改进的YCbCr空间中对手势图像进行了分割,省去了灰度化的步骤,直接得到二值化图像,其分割效果比普通灰度化再二值化的方法更加准确。继而对分割后的二值图像进行了去噪平滑的处理,通过膨胀腐蚀和区域生长运算去除了二值图像中的毛刺,并填充了内部细小的空洞,使手势区域更加完整。然后对不同的轮廓提取方法进行了比较分析,最终选择提取了二值图像的连续轮廓,提取了图像的结构特征作为粗分类的标准,提取傅里叶描述子和Hu矩特征作为细分类的标准,最后利用Hausdorff距离实现了静态手势的识别。实验结果表明,本文采用的算法可以很好的将手指语进行分类,具有较高的运算速率和识别率,具有一定的理论创新和社会价值。