基于视觉特性的视频编码技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:nizhongyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的到来,人类也随之进入了一个崭新的网络多媒体时代,作为诸多计算机研究中最为活跃领域之一的多媒体视频编码技术也随着应用要求的改变而不断发展着。近年来,图像和视频压缩取得了很大的进步。然而,图像和视频信息的最终接受者是人,而现今的图像和视频压缩大都是基于像素间的统计冗余的,忽视了知觉上的冗余信息。从本质上说,压缩机制和视觉系统面临着一个相似的问题:怎样以一种高效的方式来描述视觉对象。如果能在压缩系统中采用某种视觉技术来达到获取较低码率和较高视觉质量的目的,是很有意义的。为此,本文对人眼视觉系统的视觉特性进行了研究,提出了基于人眼亮度适应性,时空域掩藏效应等特性的视频压缩方法。视频压缩中,由于人眼实际得到的是解压缩后的图像,因此对重建图像质量的评价是人们非常关心的问题。本文在总结了各种视频质量评测方法的基础上,对基于结构失真的视频质量评测方法SSIM进行了分析和实现,并采用该方法对本文提出的视频压缩方法进行性能评测。人眼的视锥细胞和神经细胞的分配是高度不均匀的,在小凹处密度很高,而周边区域的细胞密度则下降很快。因此HVS对视频图像的分辨率也是高度不均匀的。结合人眼的这种特性,本文对基于小凹的视频编码模型进行了研究,并在此基础上提出了基于内容自适应foveation模型的视频编码方法。在假设关注点在视频图像中心的情况下,根据视频序列的内容对该视频不同区域的分辨率进行调整。实验结果表明,该方法能够获得较好的压缩效率。考虑到观察者在观察视频图像的时候,其关注区域是在不断变化的,并且不同的观察者,其关注区域也是不同的。因此,本文结合运动关注模型给出了基于多关注点的视频压缩方法。在获取了视频帧运动矢量场之后,利用运动矢量强度和运动矢量方向的一致性对视频中的关注区域进行度量。然后根据该度量值,选取用于foveation编码的多个关注点。实验结果表明,该方法能够获得与人工标定关注区域获取相似的结果。
其他文献
近年来,数据库中的数据量与日俱增、数据形式多种多样,但各种应用的核心—数据,仍以不同形式存储在不同的系统中,分而不聚,聚而不合,呈分布异构状态。越来越多的用户希望能够
数据挖掘是人工智能领域的一个热点研究问题,是探讨如何智能地从大量数据中提取出有用的信息和知识。粗糙集与概念格作为数据挖掘分析中两种有效途径,在关联规则提取应用中得
无线通讯网络的发展如火如荼,基于电路交换的无线通讯系统逐步被基于分组交换的全IP网络取代。UMTS(UniversalMobileTelecommunications通用移动通讯系统)作为3G的主要标准,得
操作系统是计算机软件与硬件资源的管理者,控制着整个计算机系统的运行。它直接和硬件交互并为用户提供接口,是计算机软件的运行核心和基础。因此,操作系统安全是整个计算机
随着中国经济的迅速发展和对外交流的日益增加,英语口语作为日常交流的常用工具,地位越来越重要。计算机辅助口语学习能够更好的帮助人们练习英语口语,而口语发音评估是其中一个
在变电站巡检机器人系统中,机器人拍摄的巡检图像的计算机分析与处理是该系统核心组成部分之一。通过对图像中的设备进行状态识别,就可以自动监控变电站的工作状态。对于同一
随着20世纪多媒体技术及Internet网络的发展,可获取的图像和其它多媒体数据越来越多,数据库容量不断增大,如何组织、表达、存储、管理、查询和检索这些海量的多媒体数据,是对
本文研究工作是针对CBIR技术、网络搜索引擎和MMS技术的应用背景,以构建具有移动性能的基于内容的网络搜索引擎为目标,提出了可以利用MMS信息进行基于内容检索的检索系统设计
椭圆曲线密码(ECC)是一种公钥密码体制。它所提供的功能与众所周知的RSA公钥密码体制是一样的。RSA将它密码的安全性基于大整数因子分解的难解性之上,而ECC则将安全基于椭圆
生命科学、生物医学与计算机技术、网络技术的相互结合给医疗发展带来了革命性的变化。医疗方式正在从以往的循证医疗,向个性化医疗的方向发展。医疗信息系统作为医学信息学