MPEG-4中人脸视频对象的模型基编码研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:h243173982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络的广泛普及和人们对多媒体信息需求的不断提高,低码率的图像压缩编码技术成为一个活跃的研究领域。模型基图像编码方法由于在码率和图像质量性能上比传统编码方式有了很大提高,因此受到了极大的关注,并在MPEG-4标准中得到了体现。MPEG-4中定义了人脸对象,并提供了相关的工具来处理这一对象。 本文研究了MPEG-4中人脸视频对象的模型基编码,对整个系统进行了全面的分析,将系统按编解码结构分成分析和合成两部分。在图像分析中,利用颜色、灰度和梯度信息寻找特征区域,解决模板初始化位置问题,并用模板匹配方法估计表情运动参数。另外,利用点匹配法跟踪相邻帧特征点的位移,估计头部整体运动参数。并将这些参数转化为符合MPEG-4标准的FAP,进行压缩。根据实际情况,还增加了三个头部平移的FAP。合成部分实现了图像的重建。误差掩盖后的参数通过KD肌肉模型映射为线框模型顶点的运动,然后用纹理映射产生真实感的图像。文中提出了一种符合MPEG-4标准的表情FAP参数的分级描述,可作为FAP的插值规则。为了探讨算法可行性,对合成部分的运算量进行了统计,表明在实验条件下,实现该部分的实时处理是可行的。 除了图像分析合成,模型基编码中还有很重要的一个部分就是特定人脸模型的生成。本文讨论了其他研究者在这方面的做法后,提出了一种实用的根据人脸正面视图匹配模型的方案,并开发了ModelMatch工具来实现这一功能。模型匹配分两个步骤:先是用本文提出的径向收缩法满足控制点位置的匹配,然后在此基础上,将线框模型看成是有弹性的,并分不同区域采用不同的调整规则,进行整个线框中其他受控点的调整,匹配出了包含真实纹理的特定人脸模型。 论文最后介绍了模型基编码在开发视频聊天系统Grimace Chat中的应用,并展望了今后的工作方向。
其他文献
期刊
期刊
星基定位系统,特别是GPS(Global Positioning System),在军用和民用领域被广泛应用于定位、导航以及其他与位置有关的服务。但是,GPS信号在用户端是非常微弱并极易被干扰的。因此,G
期刊
期刊
论文对国内外类似系统和计算机网络实验的实际情况进行了广泛调查,对现阶段远程实验教学进行全面的研究,并在此基上运用面向对象的分析和设计方法,确定了计算机网络虚拟实验
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)是下一代无线通信的核心技术,具有频带利用率高、抗多径干扰能力强、抗频率选择性衰落能力强等众多优点,但是
期刊
期刊
期刊