论文部分内容阅读
随着各种3-D应用的蓬勃发展,多视点视频以其广泛的应用价值受到研究者的重视。但多视点视频由于其视点数目众多、数据量庞大,不易处理。本文主要针对多视点视频压缩编码领域,在多视点视频预测编码结构的随机访问、多视点视频编码快速算法、多视点颜色校正、基于压缩感知的深度图编码等方面做了相关研究。多视点视频预测编码结构需要具有随机访问性。为准确衡量随机访问性能,本文提出一种新的随机访问评价方法。方法基于图论原理,将多视点视频预测结构视为有向无环图进行处理,建立预测结构的数学模型。在此模型基础上,分析了预测结构中帧与帧的相互依存关系,提出随机访问度的概念与其计算方法,能对多视点视频预测结构的随机访问性能进行简单有效的客观评价。多视点视频对编码速度提出了更高要求。本文提出两种多视点视频编码快速算法:基于全局视差的自适应搜索范围调整算法(ASRA)以及基于等级B帧结构的视间参考帧自适应选择算法(ASIR)。ASRA采用当前块视差矢量与全局视差之间的统计规律对搜索范围进行自适应调整,ASIR使用等级B帧预测结构的低时间层预测信息减少高时间层图像的不必要的视间参考帧数目,从而提高了预测速度。本文快速算法主要应用在多视点视频的视点间预测中,可以与传统的帧内和帧间快速算法联合使用。多视点视频在不同视点间会存在颜色的差异,从而影响预测编码效率。本文提出一种多视点视频颜色校正算法:去相关颜色校正算法。采用相关分析和距离分析手段获取得到最佳匹配点,根据匹配点的三色激励值,设计基于线性无关颜色空间的去相关颜色校正算法,结果表明,算法能对多视点视频各个视点进行较好的颜色校正,在主观效果上视点间颜色趋于一致,对校正后的视频进行编码,能获得较高的率失真增益。本文将压缩感知结合到图像和视频编码技术中,提出量化即是采样测量的新观点,研究在量化得到的部分2-D DCT和整数变换系数基础上重构图像信号的方法,并设计相应的编解码流程。本方法对梯度稀疏的图像尤其有效,而3-D图像和视频视点合成中广泛使用的深度图,恰好符合这种特征。因此,本文主要将压缩感知应用到深度图的压缩编码中,在JPEG和H.264/AVC等实际编码系统中进行了验证,结果表明压缩感知能极大地提高对深度图的编码效率。