论文部分内容阅读
随着数字媒体技术的发展,视频数据量呈现爆炸性增长,如何高效地压缩视频成为巨大的挑战。国际电信联盟ITU-T和国际标准化组织ISO/国际电工委员会IEC,一直致力于制定有效的视频编码标准,来应对这一挑战。目前国际最先进的视频编码标准为H.265/高效视频编码(High Efficiency Video Coding,HEVC),比H.264/高级视频编码(Advanced Video Coding,AVC)的编码效率提高了一倍。但是人眼毕竟是视频数据的最终接收端,根据人类视觉系统的感知特性可知,将人类视觉系统的感知特性与视频编码相结合,剔除视频中的视觉感知冗余势必能带来更好的编码增益。基于此,本论文将人类视觉感知特性加入到视频编码框架中,提出了基于视觉感知的高效视频编码优化方法,主要有以下几个方面的研究:1、在HEVC中,基于I帧(Intra frame)的编码树单元(Coding Tree Unit,CTU)级比特分配算法采用同位CTU的均方误差(Mean Squared Error,MSE)或平均绝对差(Mean Absolute Difference,MAD)作为比特权重来指导比特分配,这种做法没有充分考虑人眼的视觉感知特性。因此,提出了一种基于空域视觉感知失真的比特分配算法。首先,采用融合空域掩蔽效应的感知失真评价标准替换传统的失真评价标准,建立新的空域感知失真与码率的关系模型,接下来,通过数据统计和拟合的方式验证模型的准确性。此外,提出了两种参数估计方法来求解参数模型。最后,通过率失真优化理论以及拉格朗日乘子法推导求解出每个CTU的感知权重因子指导比特分配。为了验证所提算法的性能,采用空域感知失真评价模型对所提算法进行率失真性能评价。还使用了其他七种视频质量评价模型对所提算法进行性能评估。实验结果表明在相同感知质量的情况下,所提算法平均降低了6.27%的编码比特率,大大提高了编码性能。2、对于I帧图像的比特分配考虑空域视觉感知特性可以很好的提高编码效率,但对于非I帧图像的编码仅仅考虑视频的空域感知特征不足以充分剔除视觉感知冗余。因为视频是由一帧帧图像组合而成的,在编码非I帧图像时还需要考虑视频的时域感知特性,利用融合了时空域视觉特征的感知模型可以更好的评估非I帧图像的感知失真。所以提出采用基于时空域感知失真模型指导视频编码中的码率控制技术。首先,除去视频中的I帧图像,通过统计过程得到非I帧图像的时空域感知失真和码率之间的关系模型。然后,根据非I帧时空域感知失真和码率之间的关系,得到每个CTU的感知权重。之后,根据感知权重来指导CTU级比特分配。最后,利用R-?和QP-?模型,得到编码的量化参数值,进而指导CTU级码率控制算法。所提算法与JCTVC-K0103算法相比,大大提高了视频编码的效率。3、为了满足临床治疗所需的图像质量以及尽可能的提高压缩率,提出了一种用于病理切片图的基于感兴趣区域(Region of Interest,ROI)的视频编码方法。首先利用病理切片图的感知特性确定图像阈值,将病理切片图分为感兴趣区域和非感兴趣区域。然后分别确定病理切片图中感兴趣区域和非感兴趣区域的感知失真值。针对病理切片图的感兴趣区域采用人眼不可察觉失真的方式压缩,对于临床非感兴趣区域在不影响视觉效果的前提下采用最大失真压缩。实验表明分区域压缩病理切片图的编码方式比采用同一种方式压缩病理切片图节省比特率92%。在编码的过程中,为了控制不同区域的感知质量,要遍历所有的量化参数并计算出对应的失真值,计算复杂度比较高。通过建立失真与量化参数之间的关系模型,可以快速实现量化参数的选取,大大降低了编码的复杂度。实验表明基于感兴趣区域的病理切片图快速编码方法比全遍历编码方法的时间节省率为97%,不仅保持了编码的压缩效率,而且大大降低了编码的复杂度。本文所提出的基于视觉感知的高效视频编码优化方法,充分考虑了如掩蔽效应、对比敏感度,视觉注意力机制等人类视觉感知特性。将感知模型加入到视频编码框架中,剔除了人眼的感知失真,优化了比特资源分配,有效的提高了视频编码的效率。将感知编码运用到病理切片图中,大大提高了病理切片图编码的压缩效率。本课题的研究对感知编码的发展有一定的理论依据,对视频会议、图像视频压缩、媒体传播、智慧医疗等有着积极的指导意义。