论文部分内容阅读
随着信息化时代的到来,人类也随之进入了一个崭新的网络多媒体时代,作为诸多计算机研究中最为活跃领域之一的多媒体视频编码技术也随着应用要求的改变而不断发展着。近年来,图像和视频压缩取得了很大的进步。然而,图像和视频信息的最终接受者是人,而现今的图像和视频压缩大都是基于像素间的统计冗余的,忽视了知觉上的冗余信息。从本质上说,压缩机制和视觉系统面临着一个相似的问题:怎样以一种高效的方式来描述视觉对象。如果能在压缩系统中采用某种视觉技术来达到获取较低码率和较高视觉质量的目的,是很有意义的。为此,本文对人眼视觉系统的视觉特性进行了研究,提出了基于人眼亮度适应性,时空域掩藏效应等特性的视频压缩方法。视频压缩中,由于人眼实际得到的是解压缩后的图像,因此对重建图像质量的评价是人们非常关心的问题。本文在总结了各种视频质量评测方法的基础上,对基于结构失真的视频质量评测方法SSIM进行了分析和实现,并采用该方法对本文提出的视频压缩方法进行性能评测。人眼的视锥细胞和神经细胞的分配是高度不均匀的,在小凹处密度很高,而周边区域的细胞密度则下降很快。因此HVS对视频图像的分辨率也是高度不均匀的。结合人眼的这种特性,本文对基于小凹的视频编码模型进行了研究,并在此基础上提出了基于内容自适应foveation模型的视频编码方法。在假设关注点在视频图像中心的情况下,根据视频序列的内容对该视频不同区域的分辨率进行调整。实验结果表明,该方法能够获得较好的压缩效率。考虑到观察者在观察视频图像的时候,其关注区域是在不断变化的,并且不同的观察者,其关注区域也是不同的。因此,本文结合运动关注模型给出了基于多关注点的视频压缩方法。在获取了视频帧运动矢量场之后,利用运动矢量强度和运动矢量方向的一致性对视频中的关注区域进行度量。然后根据该度量值,选取用于foveation编码的多个关注点。实验结果表明,该方法能够获得与人工标定关注区域获取相似的结果。