人脸视频图像的压缩编码

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:chiale
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸视频图像编码是近年来图像编码领域里的一个研究热点问题,它在通信、互联网等方面有着广泛的应用前景。人脸图像编码的研究包含很多子问题,主要的三个方面为:精确的人脸目标定位算法,实时的人脸目标跟踪算法和高效的人脸图像编码方法。本文的主要研究工作在于: 1) 提出帧间差分和背景差分相结合的人脸目标定位算法,在人脸特征选择上,主要使用形状特征,通过椭圆拟合来得到人脸的位置。 2) 采用基于Kalman滤波的运动预测方法对人脸的区域变化进行预测,以此缩小目标可能存在的区域(ROI),然后在这个小范围内进行人脸检测,从而达到实时跟踪的目的。 3) 使用分块的主成分分析方法(PCA)对人脸图像进行压缩编码。针对PCA方法计算量大的缺点,首先把问题转化成奇异值分解(SVD)问题,然后设计了特征空间的更新算法,通过递推,简化每一步计算的计算量,达到了实时编码的要求。 4) 在Windows平台下基于Video for Windows(VFW)接口开发了人脸视频图像编码和解码的实验系统,该系统实现了图像采集、图像显示、编码、解码等功能。
其他文献
在三维Minkowski空间R31中,本文称满足x3=1的参数s为规范化参数,称满足这类Frenet方程:(X Y X)=(00 k00 k/2 k/2 k0)(X Y Z).的标架F={X,Y,Z}为规范化Cartan标架,而此时的(α,F)被称为一
约束矩阵方程问题广泛应用于自动控制、振动理论、系统参数识别及非线性规划等领域。本文分别从递推算法及利用奇异值分解、标准相关分解和广义奇异值分解的直接算法,从两个不
CDMA系统中,多个用户同时随机接入,由于码字不正交引起多址干扰(MAI),由于各用户的接收功率不同引起远近效应。传统方法采用匹配滤波器接收,受到MAI的严重影响。理论上已经证明采
本文将源起于统计物理学中的相互作用粒子系统、渗流等理论同数理金融学中证券股票市场进行结合,分别对股票市场的价格、指数、指标等问题进行研究、模拟和分析. 第一部分
本文对半正则环和强π正则环的推广进行了研究。文章首先定义了I-半π正则环,并给出了一系列的等价刻画。推广了周毅强教授关于半π正则环的结果以及Nicholson和Zhou于2005年
非线性系统是近年来控制理论研究的重点和热点之一.本文首先综合介绍非线性系统的有限时间收敛性的研究工程背景、理论意义、研究现状及存在问题,并给出了非线性控制系统有限