基于机器学习的分布式视频编码研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:myg3801403
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对视频业务使用的不断加,越来越多新的要求在实际生产被提出。移动视频设备、军用无源视频设备、监控设备等一系列应用场景要求视频编码系统具有码率尽可能的低,编码端尽可能的简单的特点。为了应对这些需求,分布式视频编码(Distributed Video Coding,DVC)应运而生。分布式视频编码是一种基于分布式信源编码(Distributed Source Cording,DCS)的编码方式,与传统视频编码MPGE、H.264不同的是分布式视频编码采用独立编码-联合解码的编解码方式,在编码端每一帧独立编码,把传统视频编码中复杂的运动估计从编码端转移到解码端,很大程度上降低了编码端的复杂性。而在解码端仅需要较少的非关键帧信息,便可以完成对运动估计生成的边信息优化,从而达到降低码率的目的。本文主要就分布式视频编码小波域高阶建模并结合机器学习技术进行研究,主要研究内容如下:1)在以往DVC研究的基础上,针对传统常用的DVC框架不能有效的利用视频中的高阶信息的问题,本文使用经典边信息生成算法,提出一种可以充分使用视频高阶信息,并能够方便的和机器学习算法相结合的改进框架。2)本文在研究过程中,针对当前分布式视频编码系统在非关键帧重构过程中只使用视频时域特征及空域特征等低阶的特征的问题。受JPEG2000的显著性传播传递(Signifificance Propagation Pass,SPP)和震级细化传递(Magnitude Refifinement Pass,MRP)思想所启发,研究要解码的当前系数与其相邻系数之间的位平面级相关性,使用AdaBoost集成学习方式,结合CART决策树,形成一种提升树算法,提出视频中的基于AdaBoost的高阶特征建模算法(High-Order Model Base AdaBoost,HOMBAB)。并结合基于小波域的DVC,选取四个不同运动强度的视频序列进行仿真,证明该方式的合理性。3)利用HOMBAB,使用本文提出DVC框架,提出新的DVC算法。该算法分利用了小波变换后视频在高阶域中的特征向量,通过使用AdaBoost算法完成分类器的构建,最终得到结果优于未对其高阶特征进行学习的方式。本文从主观视频质量和客观视频质量两个方面评估算法。实验结果表明本文所提出的HOBAB-DVC在主观视频质量上可以还原出更丰富的细节,在客观指标方面,码率平均节省15%,PSNR有0.3到1.5d B的提升。
其他文献
为了适应日益增长的三维动画、游戏、虚拟现实、医学图像重建和文物保护等领域的建模需求,针对自动三维重建方法的研究日趋活跃。本文以基于多传感器信息的三维重建算法为研究课题,重点研究了基于单目或多目彩色图像的三维对象重建算法以及基于深度信息的三维场景检索算法。由于传统算法需要大量的图像数据作为输入,且在运行速度上还不能令人满意,因此随着深度学习技术的快速发展,越来越多的研究人员开始尝试使用深度神经网络来
随着硬件水平的不断提升与相关研究的持续推进,图像融合技术在各个领域的应用都在不断深入发展。同时,随着计算机算力水平的不断提升,卷积神经网络理论也在迅猛发展,已经被广泛应用于目标识别、人脸识别等多个领域。一方面,引入卷积神经网络可以改进图像融合中的特征提取与分配环节,在此条件下重新设计的图像融合框架可以提升融合图的融合质量。另一方面,现有的相关论文鲜有基于卷积神经网络设计的三通道或多通道的图像融合模
边缘计算拥有低时延和高安全等诸多优点,边缘计算可以看作“微云”,相比云来说其本身的计算资源、存储资源都更受到局限。在边缘设备上会有多种异构终端接入、异构数据存储且多种应用运行其上,边缘设备提供安全的支持系统是边缘设备安全的基础。Docker是基于“沙箱机制”的一种轻量级容器引擎,将底层文件、镜像和应用程序等统一打包的虚拟化技术其具有统一的标准化打包流程、强大的可移植性和隔离各个应用的安全性等优点,
随着人机交互技术的不断发展,Web应用服务性能与用户体验已经成为衡量Web应用运行质量的重要因素。用户体验评价方面,除了渲染时延这一常规指标以外,因用户因体验不佳而产生的异常行为也是重要的评价参考,而Web应用服务性能评价指标则通常包括云端服务响应请求的平均速率、稳定程度以及渲染端解析服务器响应资源的效率。用户在访问Web应用时产生的用户行为与Web应用服务性能之间的关系密不可分。例如:当请求服务
调制解调是信号检测和信号解调之间的关键技术,在非合作通信中起着至关重要的作用。调制识别技术在民用和军事领域都应用广泛,怎样在实际通信传输过程中,实现对接收信号调制方式的准确识别,是目前在调制识别技术当中迫切需要解决的难题。本文针对传统调制识别方法中所存在泛化能力弱、鲁棒性差等缺点,将深度学习应用到调制识别领域,并选用了模型更小的轻量级神经网络作为识别模型,提升了准确率的同时极大地减少了计算量,本文
石油是维持现代社会正常运转的重要能源之一,石油开采过程中一旦发生泄露,将会造成严重的生态灾害和巨大的资源损失。近年来视频监控技术在油田安全巡检中引起广泛的关注,由于视频监控图像具有直观方便的特点,在石油安全巡检中引入计算机视觉技术进行在线监控,及时发现油田采油作业过程中可能出现的故障,可以节省人力资源的消耗并保障安全巡检的质量和效率。传统的漏油检测采用LDR(Low Dynamic Range I
近些年来,运动捕捉技术在多个领域获得了越来越广泛地应用。基于惯性测量的运动捕捉系统相较于其他运动捕捉设备,成本低廉、使用方便、稳定性强,具有很高的研究价值。本文基于惯性测量技术设计研究了一种价格低廉、实时性良好的人体运动捕捉系统。本文的主要研究工作具体如下:1.分析了人体姿态跟踪系统的具体需求,并根据使用需求给出了系统的整体设计框架,完成了系统的硬件选型与制作以及上位机的软件选取。2.对三种传感器
缺陷检测是常见且重要的工业场景,由于待检测产品及其缺陷的多样性,传统的机器学习算法在可复用性上表现不佳。卷积神经网络以其强适应性和转换简单等优点在缺陷检测领域得到了迅速而广泛的运用。然而,由于图像表面众多像素级的缺陷特征的提取非常困难,即使特征金字塔可以针对小缺陷特征进行提取,而不同尺度特征图耦合时会损失大部分微小缺陷的特征,使得大背景下微小缺陷检测存在困难,性能难以提升,成为缺陷检测领域研究的热
随着人们生活水平的提高,居民私家车的数量在最近几十年急速增长,这使得人们对于出行需求逐渐由公共交通转为更加快捷舒适的私家打车出行,但是有限的道路与能源资源却不能无限满足私家车数量与人们对打车需求量的增长。另一方面,随着打车出行人数的增加,传统的“一人一车”的服务方式运营效率非常低下,使得车辆座位利用率极低,但是使用频率却越来越高,越来越不能满足大多数人的出行需求。近几年兴起的“共享经济”使得合乘出
视频监控是安防及应急救援的重要组成部分,因其呈现方式直观、传递信息多元而广泛应用于各类场景之中。传统方法的视频监控主要存在三大问题,其一是缺少视频智能分析,在监控过程中需要依靠人工同时对多个摄像头所拍摄的监控画面进行较长时间的观察,而且仅能对监控内容给出主观的判断,使得工作效率较低。其二是缺乏灵活监控,大多数的摄像头采用固定安装的方式,易存在监控盲区,同时极易受限于光照的变化,在更为重要的低照度或