论文部分内容阅读
视频运动对象分割主要目的是从连续视频帧中准确地分离出包含特定视觉效果的运动物体。其应用范围极其广泛,覆盖了智能交通、视频安全监控、国防、航空航天和天体研究等领域。目前,针对特定运动物体的分割算法的研究已取得了很大的进展,出现了不少著名的算法。但是这些算法大多适用于视频监控之类摄像机固定的特定应用中,对于更广泛的摄像机不固定、运动对象类型不限定的应用领域,目前已有的算法还不能很好的适应。对于一般化的应用场景,摄像机视角的变化导致视频分割的背景是无规则地变化的,这使得基于背景建模这一类经典的分割算法无法对视频的背景进行正确建模。另一方面,由于对运动对象类型不限定,导致基于事先样本训练分类来进行分割的算法无法获得良好的效果。因此,如何在摄像机不固定、运动对象类型不限定的场景中实现运动对象的自动分割成为当前研究的难点和热点。针对当前视频分割研究的现状和趋势,作者大量的研究和学习了国内外现有视频分割算法,提出了两种基于目标注意理论的视频分割算法。(1)基于运动对比时空视觉注意模型:首先,用SIFT算法来建立相邻视频帧之间特征点之间的对应关系,并计算对应关系之间的差异来衡量相邻视频帧之间存在的运动差异。以运动差异为标准建立时域映射。然后将视频图像分割成以超像素为单位的不同区域,通过计算区域之间的全局特征差异(包括色彩,大小空间距离等因素)来构建视频空域显著性映射。在混合的时空显著性映射约束下,以超像素区域为基本单位,计算各单位的显著性能量来完成视频图像前背景的分割。该模型的优势是时空域的显著映射关系各自独立获得,并以一种合理的方式组合到一起。此外,以超像素作为分割区域的做法有一定创新性且能让分割的边界更加精确。(2)基于四元小波变换的多分辨率时空模型:首先:通过四元数形式的小波变换建立四元金字塔。借助视频领域帧的相位差来衡量视频运动显著性并建立起相对应的时域映射。相位的数值可以用细节滤波器从各级金字塔中分离出细节信息来计算得出。另一方面,通过对中心周围多尺度权重响应施以逆四元小波变换来建立视频帧的空域显著性映射。其中多尺度权重计算函数ECSF是从其他文献中优化得到的,中心周围区域则是以小波系数对应位置来构造。最后,以经过合理的筛选和动态混合建立时空显著性映射为约束条件,对视频图像的前背景进行初次分割,并用Grabcut方法来优化初步分割结果。这个分割模型能够充分利用多分辨率分析理论信息量丰富的优势。由于结合了四元数理论,处理速度上比一般小波变换要快很多。实验过程中,采用不同的视频数据对该算法的有效性进行测试,并与其他分割算法的结果进行比较。最后的实验结果表明,本文提出这两种算法正确率和处理速度也能令人满意。