论文部分内容阅读
随着信息技术的飞速发展,视频信息的采集更加容易,由此产生了海量的视频数据和各种各样的视频应用。人们对视频数据的检索和传输提出了更高的要求。视频镜头边界检测是进行视频分析和检索的基础。视频转码是视频进行网络自适应传输的关键技术。本文对视频镜头边界检测和H.264至MPEG-4视频转码两个方面进行研究和实践。1.视频镜头边界检测本文从当前视频镜头边界检测的主要技术出发,将影响镜头边界检测性能的因素归纳为三点:视觉内容的表示、序列图像上下文关系的构建和模式分类和识别方法三个方面。在此基础上考虑镜头边界检测的特征描述、切变渐变检测策略及检测系统框架,从而提出了一种多层次特征描述和SVM分类的实时镜头边界检测的系统方案。为了评估该算法,我们参加了RTECVID2007 SBD的评测。评测结果显示本文算法的检测速度远超实时要求,对切变检测的平均查全率和查准率都在96%以上,对渐变的检测效果还有待提高。2.H.264至MPEG-4视频转码本文在比较分析H.264和MPEG-4编码标准异同和常用视频转码框架的基础上,提出了一个高效的H.264至MPEG-4的级联像素域转码器框架。并针对视频转码的功能需求,实现和改进了如下视频转码关键技术模块:(1)针对H.264至MPEG-4视频转码的特点及码流结构,设计和改进了基于线性信源的ρ域模型的码率控制算法,可以对GOP层、帧层及宏块层进行码率控制。实验结果显示,与Xvid的“single pass”码率控制算法相比,本文提出的速率控制算法的输出码率更接近目标码率,码率波动更平稳,输出码流的平均PSNR值也相当。(2)通过统计分析方法,提出了宏块类型转换和运动矢量映射方法。实验结果表明,与全解全编算法相比,本文算法在分辨率不变时的转码PSNR值下降均在0.5dB以内,转码速率提高了30%以上,而在2:1图像下采样转码中,转码速度也能提高近20%。(3)在任意比率图像下采样转码中,设计了8抽头的任意比下采样滤波器,并采用覆盖面积加权平均法进行宏块类型转换及运动矢量映射。实验结果表明,与全解全编算法相比,本文算法的转码PSNR在多数情况下降约1dB。