面向立体显示的实时人眼定位算法

来源 :南京大学 | 被引量 : 0次 | 上传用户:icnew
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人眼的跟踪定位是无辅助立体显示系统的关键模块,该模块的性能对用户的观看体验有着直接的影响。通过快速且精确地获取用户双眼的位置,配合先进的光学设备,可以使得用户在不佩戴任何辅助设备的情况下观看立体显示器。同时人眼定位技术也是智能化技术的重要内容,有着丰富的应用方向和广阔前景。  本文采用由粗到精、分级定位的方法。首先采用改进的椭圆模型,在YCbCr空间检测肤色,并在不同尺度下利用积分图和肤色覆盖率快速筛选候选区域;然后采用人脸-人眼两级分类器检测人眼区域,其中人脸的分类器由11级AdaBoost强分类器组成,人眼分类器由3级AdaBoost分类器和1级SVM分类器组成;在获取人眼区域信息之后,在此基础上进行瞳孔精确定位。本文论证了多种瞳孔精确定位方法,比较了它们在定位的效果和效率方面的性能,最终选择了混合投影算法并在原始算法基础上做了改进;为了克服定位点的无规则跳变,本文提出了一种基于运动相关性的滤波方法,利用人眼定位结果和跟踪数据在总体变化趋势上的相关性,可以实时地判断当前定位结果是否有效。  另外,在人脸检测的前端,本文采用了卡尔曼预测以及检测帧/跟踪帧动态切换策略来进一步加速处理,提高整体效率。  在AdaBoost分类器训练部分,采用了合理化分布的样本,并根据人脸灰度分布特性对最终得到的弱分类器进行后期权重的调整,同时将原先基于CPU的训练程序移植到GPU上实现,通过引入最新的GPGPU技术,极大地提高了训练速度。基于此训练得到的分类器有很好的鲁棒性,尤其是对大面积遮挡和表情变化有很强的适应性。  当然本文的方法中还有一些方面需要改进,在定位精度和成功率方面还有提高的空间,对于环境光照变化的适应性仍显不足,分类器的训练算法和流程还不够快速和系统,这些都是未来改进的方向。而且现在仅限于处理处于正面和有小角度倾斜的人脸,如何有效地处理更多姿态的人脸且保证实时性,也是下一步要解决的问题。
其他文献
期刊
期刊
期刊
期刊