基于视觉感知的高效视频编码优化方法

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 0次 | 上传用户:yxl0173
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字媒体技术的发展,视频数据量呈现爆炸性增长,如何高效地压缩视频成为巨大的挑战。国际电信联盟ITU-T和国际标准化组织ISO/国际电工委员会IEC,一直致力于制定有效的视频编码标准,来应对这一挑战。目前国际最先进的视频编码标准为H.265/高效视频编码(High Efficiency Video Coding,HEVC),比H.264/高级视频编码(Advanced Video Coding,AVC)的编码效率提高了一倍。但是人眼毕竟是视频数据的最终接收端,根据人类视觉系统的感知特性可知,将人类视觉系统的感知特性与视频编码相结合,剔除视频中的视觉感知冗余势必能带来更好的编码增益。基于此,本论文将人类视觉感知特性加入到视频编码框架中,提出了基于视觉感知的高效视频编码优化方法,主要有以下几个方面的研究:1、在HEVC中,基于I帧(Intra frame)的编码树单元(Coding Tree Unit,CTU)级比特分配算法采用同位CTU的均方误差(Mean Squared Error,MSE)或平均绝对差(Mean Absolute Difference,MAD)作为比特权重来指导比特分配,这种做法没有充分考虑人眼的视觉感知特性。因此,提出了一种基于空域视觉感知失真的比特分配算法。首先,采用融合空域掩蔽效应的感知失真评价标准替换传统的失真评价标准,建立新的空域感知失真与码率的关系模型,接下来,通过数据统计和拟合的方式验证模型的准确性。此外,提出了两种参数估计方法来求解参数模型。最后,通过率失真优化理论以及拉格朗日乘子法推导求解出每个CTU的感知权重因子指导比特分配。为了验证所提算法的性能,采用空域感知失真评价模型对所提算法进行率失真性能评价。还使用了其他七种视频质量评价模型对所提算法进行性能评估。实验结果表明在相同感知质量的情况下,所提算法平均降低了6.27%的编码比特率,大大提高了编码性能。2、对于I帧图像的比特分配考虑空域视觉感知特性可以很好的提高编码效率,但对于非I帧图像的编码仅仅考虑视频的空域感知特征不足以充分剔除视觉感知冗余。因为视频是由一帧帧图像组合而成的,在编码非I帧图像时还需要考虑视频的时域感知特性,利用融合了时空域视觉特征的感知模型可以更好的评估非I帧图像的感知失真。所以提出采用基于时空域感知失真模型指导视频编码中的码率控制技术。首先,除去视频中的I帧图像,通过统计过程得到非I帧图像的时空域感知失真和码率之间的关系模型。然后,根据非I帧时空域感知失真和码率之间的关系,得到每个CTU的感知权重。之后,根据感知权重来指导CTU级比特分配。最后,利用R-?和QP-?模型,得到编码的量化参数值,进而指导CTU级码率控制算法。所提算法与JCTVC-K0103算法相比,大大提高了视频编码的效率。3、为了满足临床治疗所需的图像质量以及尽可能的提高压缩率,提出了一种用于病理切片图的基于感兴趣区域(Region of Interest,ROI)的视频编码方法。首先利用病理切片图的感知特性确定图像阈值,将病理切片图分为感兴趣区域和非感兴趣区域。然后分别确定病理切片图中感兴趣区域和非感兴趣区域的感知失真值。针对病理切片图的感兴趣区域采用人眼不可察觉失真的方式压缩,对于临床非感兴趣区域在不影响视觉效果的前提下采用最大失真压缩。实验表明分区域压缩病理切片图的编码方式比采用同一种方式压缩病理切片图节省比特率92%。在编码的过程中,为了控制不同区域的感知质量,要遍历所有的量化参数并计算出对应的失真值,计算复杂度比较高。通过建立失真与量化参数之间的关系模型,可以快速实现量化参数的选取,大大降低了编码的复杂度。实验表明基于感兴趣区域的病理切片图快速编码方法比全遍历编码方法的时间节省率为97%,不仅保持了编码的压缩效率,而且大大降低了编码的复杂度。本文所提出的基于视觉感知的高效视频编码优化方法,充分考虑了如掩蔽效应、对比敏感度,视觉注意力机制等人类视觉感知特性。将感知模型加入到视频编码框架中,剔除了人眼的感知失真,优化了比特资源分配,有效的提高了视频编码的效率。将感知编码运用到病理切片图中,大大提高了病理切片图编码的压缩效率。本课题的研究对感知编码的发展有一定的理论依据,对视频会议、图像视频压缩、媒体传播、智慧医疗等有着积极的指导意义。
其他文献
自我国进行教育改革以来,将传统教学模式转变为信息化教学模式成为大势所趋。随着中职教育在国家教育中逐步兴起,在中职语文教学中越来越多的教师开始采用多媒体技术等信息化手段进行教学。网络影视资源作为信息技术教学的一部分,其形象直观的特点深受中职学生喜爱。教师将优秀的影视作品与语文学科内容进行整合优化,可在一定程度上提高学生学习积极性,调动语文课堂氛围,将两者进行综合,也在很大程度上响应了新课程改革的发展
焊接是船舶建造的主要连接手段,但因其局部不均匀的加热和冷却使得船体构件产生多种焊接变形,所以焊接变形控制得好坏在很大程度上决定了船舶的建造精度和效率。传统方法对于焊接变形的预测和控制主要是依照工人师傅的经验和大量的试验,不仅效率低、成本高,且该方法已无法适应复杂的焊接结构和现在多样的焊接方法。随着计算机技术的发展,有限元数值计算成为预测焊接变形的有效手段,但对于大型复杂结构的热-弹-塑性有限元计算
融媒体时代,"一次采集、多种生成、多元发布"成了传统媒体改变新闻采编流程的主要方向,但广播和电视作为不同介质的媒体在采访报道时有其各自的独特性。本文通过对一些城市台和
目的 观察老年人肺部感染致多器官功能不全综合征(MODSE)患者的血糖变化,分析血糖变化与MODSE发病及其严重程度的相关性.方法 对2005年1月至2014年12月在解放军白求恩国际和平
离子膜法生产烧碱是世界制碱行业的主流技术。其中,离子膜造价高昂,但原料盐水中碘的存在会对离子膜的使用寿命产生严重影响,从而增加了制碱的成本。盐水中的碘最开始以I-的形式存在,但在电解过程中I-失电子将被氧化成IO3-、IO65-等,这是淡盐水中碘的主要存在形式。随着淡盐水循环利用次数增加,这些离子将会积聚,导致二次盐水中碘的含量较高。当碘浓度高于0.2 mg/L(以I-计)时,将会与Na+、Ba2
球磨机磨矿控制系统具有多个控制变量,且各变量之间具有较强的耦合作用。本论文主要目的是提升球磨机磨矿过程中的给矿量控制与分级控制的控制效果和系统稳定性。其中球磨机给矿量控制是在对常规PID控制算法与BP神经网络算法以及粒子群优化算法研究分析的基础上采用粒子群优化后的BP-PID控制算法来实现的,而水力旋流器分级控制则采用预测控制中的动态矩阵控制算法来进行。首先,本论文对湿式球磨机磨矿控制系统的基本工
地方政府性债务是我国经济发展的支柱,但它的存在也影响着财政资金安全。社会各界也意识到政府性债务的风险并对其不同方面展开了研究。现有的理论研究从宏观微观皆有对地方政府性债务的审计模式探索。而地方政府性债务涉及的问题牵扯到多领域,具有复杂性和多变性的特点,顺应地方特色,完善地方政府性债务审计能在提高地方政府性债务审计效率的同时提升审计质量,预防和应对政府性债务风险。我国已有三次大规模地方政府性债务审计