基于时空不相似度的视频显著性模型研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:good2009good
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据生理学和心理学的知识,人类视觉系统倾向于注视那些最能刺激神经系统的视觉信号。在图像或视频中,这些视觉信号所在的区域是图像中的显著目标或视频中的运动目标。视觉注意分析模型就是通过自动生成图像或视频的显著图,模拟了人类视觉系统的这种行为。而且,视觉注意分析模型可以广泛应用于多媒体信息描述、目标检测、目标分类、行为分析、多媒体信息网络传输控制等领域。本文的具体研究工作如下所示:首先,本文回顾了视觉注意的生理机制,然后分别回顾了自底向上的显著性模型、自顶向下的显著性模型、视频显著性和图像显著性的联系和区别以及视频显著性模型的研究现状,同时还介绍了视觉注意模型的一些应用,包括图像压缩、机器人控制等。然后,本文根据人类视觉系统中视觉注意的生理机制以及心理学依据,分析并得到了人们在观看视频时影响人眼注视的四个因素,包括外观不相似度、空间位置不相似度、优先级不相似度即中央偏置以及运动特征。其中,前三个因素是空域特征,第四个因素是时域特征。其次,本文提出了一种基于时域和空域信息的视频显著性模型,该模型建立在上述四个关键因素基础上。根据视频显著性与图像显著性的区别,当人们在观看视频时,人类更加关注与其他运动目标速度差异最大的目标,因此我们可以根据人类生理学、心理学速度感知模型,建立一个速度感知显著性计算模型,用于提取运动特征。在得到的空域特征和时域特征后,本文根据建立的时空显著性融合计算模型,对空域特征和时域特征进行融合,得到了最终的时空显著图。此后,本文在多个视频片段库上进行了测试。通过与现有的国际知名注意模型相比,实验结果表明本文中模型预测的视点与人类真实视点更一致。最后,根据视觉信号在人眼中编码的生理依据,本文在上述显著性模型的框架的基础上,提出了一种基于稀疏表示的视频显著性模型。同时,对于视频数据量较大的特点,此模型采用了视频分割技术以及关键帧提取技术去训练字典,从而减少了字典训练的时间。通过与其他方法比较,基于稀疏表示的视频显著性模型在人眼注视预测中展示了更高的准确性。
其他文献
目前,网站普遍存在着不少可用性问题,给人们浏览网站带来了很多困难。要发现网站存在的可用性问题并加以有效的克服,就需要对网站进行可用性分析。目前,网站可用性分析的一种主要
文章详细地从Diffie-Hellman算法、完整性认证、机密性认证、数据源认证等方面分析了IPSec中密钥交换协议(Internet Key Exchange,IKE)的安全机制和安全特性.针对IKE可能遭受
以Internet为平台,以"教师为主导,学生为主体",实现个性化、自主性和强交互性教学是现代信息化教育发展的必然趋势.当前,在教育信息化建设方面,国内外主要侧重教育资源素材的
随着计算机软件的迅速发展,其重要性与日俱增,但其现状还不能令人满意,主要问题是:软件整体功能不强,缺乏智能;质量欠佳;生成效率低.为了解决上述问题,需要采取改进传统技术
本文以网络书店系统为实例,详细讨论了该电子商务应用系统的设计与实现,重点在电子商务个性化服务和协商议价策略方面作了较为深入的研究,并对电子商务系统的安全电子支付问
测试发现了失效后,开发人员需要找出引起失效的故障所在,即进行故障定位(Fault Location).通过故障定位,开发人员可以深入到代码内部进行故障修复,并对软件进行回归测试.当软
KDD(数据库中知识发现)一直是研究热点,目前的研究工作可分为两类:基于算法的和基于可视化的.基于算法的方法指定结果的格式,并寻找结果变量和独立变量之间的相互关系,一旦算
应用服务器(Application Server)是分布式网络环境下,为应用提供企业资源集成、事务处理、业务组件管理和部署等基础服务的支撑平台,其技术发展十分迅速,国际上已制定了一批
图像分割是指将一幅图像划分成若干互不重叠的、有意义的和具有相同性质的区域,它是图像处理和模式识别的关键环节。在众多图像分割算法中,模糊C均值算法(Fuzzy C-Means,简称
网络的飞速发展对网络管理提出了更高的要求,因此网络管理是当前网络研究的一个重要方面。嵌入式系统作为计算机应用的一个重要领域,已深入社会的方方面面,越来越为人们所关注,是