多目标的图像检测—人脸人眼检测

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:ljy2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着模式识别和人工智能的高速发展,多目标图像检测技术得到国内外社会各界的广泛的关注和深入研究。图像检测识别在科技领域和安全领域方面上都具有很强大的发展前景和广大的市场潜在的经济价值。同时,在人们的社会生活中,还是在市场商用领域,多目标图像检测也都发挥着重要的作用。   但随着社会的进步和技术的更新发展,人们对图像检测识别技术的要求也越来越高。检测率的高低和实时性的好坏是图像检测识别技术的最主要的两个性能指标,也是该技术目前所要研究突破的方向。由于图像检测技术一直受限于目标形态的多样性,目标的遮挡问题以及背景复杂度或外部环境等诸多影响,从而对降低了检测速度和精度。   本文就针对提高图像目标检测系统的整体综合性能,并实现多个目标同时检测做了以下主要工作和成果:   1.通过DirectShow构建视频采集系统,作为图像目标检测的图像采集模块,并有效的结合WDM视频捕捉,共同协作完成对构成视频图像的预览模型。由于Directshow能让复杂的数据流在不同硬件上同步传输变得简单有效,保证了后续图像检测的实时性。   2.为了提高训练的速度,解决传统Adaboost训练计算量大、时间长的问题,提高检测的精度。在Adaboost弱分类器训练时,采用了特征选取时确定阈值搜索范围,减少搜索的时间,提高阈值的最优化,使得减少了弱分类的个数,最终提高Adaboost训练的训练速度。   3.为了满足动态的图像检测实时性的需要,本文结合了分层思想和半像素匹配的快速搜索算法对图像进行实时精确的匹配,大大的减少了检测时搜索匹配的计算量和时间,提高了匹配的精度。同时,研究了小波变换理论,根据小波各频域表征的特性,在低频区域采用加权平均法,在高频区域采用基于区域的方法。   4.通过Adaboost算法分类器的训练对多姿态不同的人脸进行检测,并在检测到的人脸区域再对人眼进行粗定位,这里分别应用了Gabor小波变换的人眼定位、DCT变换人眼模板匹配的人眼定位以及adaboost训练分类器的人眼定位方法,并进行了简单的比较分析各自的优缺点及算法性能。然后再用二值化处理,积分投影变换,并结合人眼的几何知识的方法对人眼进行精确的定位并标注。由于,经过人脸检测后,图像进行了有效的归一化,已大大的缩小了人眼的检测范围,再通过图像处理,从而有效的缓解了光照的影响,以及多种方法的融合,能快速准确的锁定瞳孔位置,综合的提高了检测系统的性能。   实验结果表明,系统的整体检测效果与传统的检测方法相比,有了较明显的提高。但仍存在一些弊端,如旋转角度大的目标,检测效果就大大的降低了。如何校正旋转目标的匹配问题,需要进一步的研究改进。
其他文献
随着人机交互技术在智能化方向快速发展,越来越多的通用软件使用了智能交互技术作为新型交互手段,而当前科技领域应用最广泛的智能交互技术当属人脸识别、表情识别、人脸动画、
下一代视频编码标准H.265是视频编码专家组VCEG于2005年提出的长远规划,计划于2005-2008年间完成对H.265的完整需求定义并开始详细算法的设计。在技术研究进展顺利的情况下,
目的 探讨特布他林与布地奈德( T&B)压缩雾化吸入治疗老年慢性阻塞性肺疾病( COPD)急性加重期患者的临床效果.方法 80 例急性加重期COPD ( AECOPD)老年患者, 分为对照组与观
随着我国经济的发展,社会对互联网应用的需求日趋增长,互联网的广泛应用对我国信息产业发展产生了重大的影响。如果将我们生活的社会称为物理世界,将互联网成为信息世界的话,