论文部分内容阅读
随着计算机性能的提高、互联网和家用数字视频技术的普及,数字视频信息的数量出现了爆炸式的增长。海量的数字视频信息数据对数字视频的管理和维护提出了更高的要求。本文提出了视频海报这一全新的视频摘要与排版技术,对视频信息进行高度概括和艺术浓缩,为视频海报的制作提供了便捷的自动化制作工具,同时在数字视频数据库领域也有着重要的应用。现有的视频摘要方法主要以短帧视频或多帧序列图像为表达形式,其效果以时间序列布局,难以生成富有表现力的、能够高效表达信息并且具有吸引力的以平面为载体的视频摘要。在视频的内容覆盖方面,大多数的视频摘要方法没有考虑到视频的结构信息,例如镜头之间的关系。因此生成的视频摘要仅仅是精彩片段的集合,而没有考虑对视频内容的覆盖性。此外,从理解视频内容的观点来看,低级特征信息与视频语义之间存在着难以逾越的鸿沟,传统的基于低级特征的方法难以符合人类的视觉感知,而基于视频语义的方法还不能达到人们的期望。鉴于上述问题,本文提出了视频海报自动生成框架。首先,本文提出了排版的形式化约束,将位置对视觉心理感知的影响引入到排版算法之中,提出了位置重要性驱动的视频海报自动排版算法。针对以往研究工作的不足,本文不仅考虑了海报位置重要性的先验信息,而且提出了新的全局建议函数和互换建议函数。其次,本文提出一种统一的视频摘要方法,同时考虑内容覆盖性和重要片段覆盖性。最后,本文对现有的方法进行了扩展,建立了基于视频序列的综合视觉注意力模型。值得注意的是,本文提出了对前景目标的快速检测方法,能够准确地检测前景区域和前景运动,并且,该方法与视频格式无关。