Wyner-Ziv视频编码中边信息的生成方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:huangyuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的到来,人类对信息的需求越来越丰富。作为诸多计算机研究中最为活跃领域之一的视频编码技术也随着应用要求的改变而不断发展。传统视频压缩编码标准,如MPEG-X系列和H.26x系列,采用的都是不对称的编码结构,即编码端复杂、解码端简单。编码端的复杂度往往是解码端复杂度的5到10倍以上,主要包括变换、量化、熵编码及运动估计和运动补偿等大量的计算。这种不对称的编码方式在需编码一次而解码多次的系统,如广播或流媒体点播等系统中是非常适合的。而一些视频应用场合,如无线视频监控、无线相机、移动视频电话等,需要低复杂度的编码器,而解码器可以相对具有高复杂度。因此,传统的视频编码技术不再适用于这些应用场合。  分布式视频编码(Distributed Video Coding,DVC)作为一种新的编码方法,主要是在解码端利用相邻视频帧间的相关性,具有低复杂度的编码端和高复杂度的解码端且编码效率较高,因此,DVC较适合上述视频场合,受到了越来越多的关注。而DVC的编码效率很大程度上取决于解码端边信息的生成质量。因此,本文重点研究了如何在解码端生成Wyner-Ziv帧的边信息,以求减少编码所需码率,提高编码性能。  传统的边信息生成方法都需在解码端进行基于线性运动模型的运动估计,这种线性运动模型并不适合于运动剧烈的视频序列,而自回归(Auto-Regressive,AR)模型可以充分利用帧内相邻像素间的空间相关性,从而可以有效克服线性运动模型的缺点。因此,本文提出了基于AR模型的边信息生成方法。边信息生成部分主要有外插模块、前向推导模块、后向推导模块和融合模块。实验结果表明,本文方法可以生成高性能的边信息,并能提高整体编码效率。  本文还提出了基于棋盘模型的边信息生成方法,对基于AR模型的边信息生成方法作了改进,即将外插模块改为内插模块、加入棋盘模型、将后向推导模块改为相邻推导模块。实验结果表明,这种基于棋盘模型的边信息生成方法的性能,无论是边信息的性能还是整个视频序列的编码性能,均高于运动补偿内插方法及重叠块运动补偿方法。
其他文献
科学技术的日新月异和新军事革命的深入发展,战争的形态正由传统的机械化战争向信息化战争转变。在战争迈向信息化的进程中,信息要素已成为军队战斗力的基本构成要素,将取代物资
当前网络安全正遭受到日益严重的威胁,各种网络安全事件层出不穷。统计发现,攻击者在攻击网络系统时,主要以耗尽对方网络系统的资源为目的,如耗费被攻击者的内存资源、处理器资源
随着Internet的普及和发展,图像数据飞速膨胀,如何高效、快速的检索到所需要的图像数据成为当前图像应用领域的一个研究热点。为了便于图像的检索和识别,基于内容的图像检索
学位
基于内容的图像检索(CBIR)是多媒体信息检索领域的一项新兴技术。与传统利用文本标注的检索方式相比,它具有对图像内容描述充分、客观性强、自动高效等优点,有着极为广阔的应用
随着SOA架构的不断发展和成熟,整个IT业在向其转变。企业通过整合由其他企业提供的服务资源形成新的服务来满足用户不断变化的需求,从而增强市场竞争力。然而,各企业对外提供
判别分析(DiscriminantAnalysis)是模式识别领域的重要研究内容之一。过去几十年来,判别分析在理论和应用上均取得了很大进展。然而,在一些实际应用中,当没有足够多的有标注
基于多视角的唇动的身份识别技术,是多视角人脸识别和正面唇动身份识别的生物特征识别技术的延伸和组合。说话时的唇动信息,既体现了说话人嘴唇的固有生理特点,也反映了运动
水面倒影图像是非常常见的一种自然景观图像。目前对水面倒影图像的研究多集中在如何拍摄、制作虚拟现实的实现上,而基于视觉的对水面倒影图像理解和检测方面国内外都未开展
学位