基于三维重建技术的多视角视频编码的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hegang520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
和传统的单视角视频相比,多视角视频能以更全面的角度向人们呈现被摄的景象。多视角视频中的双目立体视频最近已成为业界的研究热点并应用于多种现实场景,而真正的多路多视角视频可在交互式电视系统等领域获得应用。由于多视角视频需要处理的原始数据量成倍增加,如何对这些数据进行高效压缩编码,是多视角视频技术中的核心问题。 在广泛而深入的研究以H.264为代表的现有视频压缩标准以及各项关键技术的基础上,本文提出了一种新型的基于计算机立体视觉中三维重建技术的多视角视频编码算法――3MVC。3MVC编码主要针对一种会聚型的多视角视频系统,适用于交互式实时多视角电视系统(IRM-TV)一类的应用场合。IRM-TV系统可以为观众带来前所未有的交互功能和多视角视觉感官体验。 3MVC编码的核心思想是:利用原始图像序列之间确定的三维几何位置关系以及三维重建原理,计算得到空间元素在待编码的视频通道图像上的成像点,由此实现在帧间预测编码过程中减少搜索次数和降低残差数值。3MVC在传统单通道视频的混合编码框架基础上,增加了对应匹配、三维预测、基于视差估计/补偿(DE/DC)的帧间预测编码等关键技术。 在3MVC所针对的多视角视频系统中,有必要在编码图像中预先获取前景目标的信息,以减少后面进行对应匹配时的计算量和提高三维重建的精度,本文提出了一种计算复杂度较低的基于图像处理中的边缘检测以及纹理块划分的前景提取算法。 计算机立体视觉领域中的三维重建技术本质是利用几何关系与图像对应来计算空间物体坐标,基于三维重建原理,3MVC为帧间预测编码提供了有益于提高DE准确性的预测信息,其中涉及的核心算法和步骤包括基于分级块匹配(HBM)的对应寻找、借鉴了H.264中的MVP概念的视差向量预测(DVP)以及三维预测。通过对应匹配和三维预测得到在编码帧中前景目标上的大量预测点,利用这些预测点可以明显的优化帧间预测过程中的宏块模式决策过程,同时通过计算对应点之间的视差向量(DV),为帧间块匹配过程更精确可靠的确定了的起始搜索位置,有效的缩小了搜索范围且增强了匹配预测精度。 实验结果表明,3MVC相比传统的帧间预测方案,在解码质量得到保证的情况下有效的降低了计算复杂度,同时也须看到3MVC在中、高码率下编码效果距离H.264还存在一定的差距。 本文的最后对整个研究工作的得失进行了总结,并指出了未来改进的方向。
其他文献
迭代重建算法(如代数重建技术和期望最大值算法)由于它的简单、有效和可执行性,已成为 CT(computerized tomography)重建中最基本的算法。然而,迭代重建算法最主要的缺点是计
作为第三代移动通信系统三大主流方案之一的WCDMA系统,是由GSM平滑过渡而来,它最大的特征是在网络结构上继承了广泛采用的第二代移动通信系统—GSM/GPRS核心网结构,该系统为
PHS(Personal Handy-Phone System)系统作为一个局部无线接入制式已经在中国广泛使用,短期内还将继续存在。第三代移动通信系统(3G)也即将商用,WCDMA(Wide-band Code-Divisio
发射低频段的对墙壁等非金属障碍物有很好穿透能力的电磁波,超宽带穿墙成像雷达有着广阔的发展前景,在反恐、救援、安检等军事与民用领域具有重要的应用价值。基于多输入多输
声反馈,是扩声系统中的一种常见现象。由声反馈引起的啸叫限制了系统扩声增益的提高,使声音产生失真,严重时甚至使系统无法正常工作。传统的声反馈抑制方法,包括改善房间声学
随着信息时代的到来,信息技术正在改变着人们的生活和生产方式、思想观念、思维方式。人们的需求也在发生变化,对信息的渴求越来越迫切,不再满足单一的业务而是希望通过一个
随着计算机网络技术的飞速发展,社会生活信息化的程度不断提高。人们通过互联网越来越容易获取需要的信息,但同时也带来了信息丢失、泄漏等安全问题。提高信息传递的安全等级
海杂波背景下的目标CFAR检测一直是雷达探测技术中的热点问题。传统CFAR检测算法多是利用某一杂波的统计分布模型来自适应设计检测门限,从而保持相对恒定的虚警概率。但是当
地杂波环境中的目标检测一直是雷达领域的研究难点,在实际战场环境中,雷达的检测性能还面临多径、干扰等多种因素的严重制约。作为新的雷达体制,OFDM(Orthogonal Frequency D