论文部分内容阅读
数字媒体和网络技术的飞速发展,产生了海量的拷贝视频。这些拷贝视频给视频存储、视频版权保护、视频检索等带来了新的问题。基于内容的视频拷贝检测作为一项重要的解决方法,成为了多媒体信息处理领域的研究热点。本文针对当前视频拷贝检测技术存在的问题并结合实际项目需要,分别从空间域和压缩域研究了视频拷贝检测方法,提出了3种可行的视频拷贝检测算法。论文的主要研究成果包括:
研究了基于镜头分割的关键帧提取算法,实现了一种融合HSV颜色直方图和梯度幅值直方图的镜头切换检测算法,并提出了基于累积直方图差的关键帧提取方法。
研究了基于全局特征和局部特征的视频拷贝检测算法,为了减少算法运算量,视频的全局特征采用HSV颜色直方图和梯度幅值直方图。同时,从匹配速度、图像模糊变换、光照变化、视角变化、缩放和旋转变化等角度研究了五种局部特征算法(SIFT、SURF、ORB、BRISK、AKAZE)的性能,结果表明AKAZE算法综合性能最优。从而提出了一种基于颜色和梯度信息全局特征、采用局部特征AKAZE算法的多层次级联式拷贝检测方法。实验表明该算法查全率为96.80%,查准率为97.95%,同时存在着检测时间过高的不足。
为了提高视频拷贝检测的速度,提出了一种基于全局特征视频词袋的快速视频拷贝检测算法。该算法利用全局Gist特征和PHOG特征在场景分类中的优势,对视频以帧为单位,将提取的Gist特征和PHOG特征进行特征组合,通过聚类创建参考视频库的视频词袋,然后用视频词袋中的单词表示查询视频和参考视频,进行序列匹配得到结果。实验表明该算法查全率为87.8%,查准率为100%,算法的运行效率得到大大改善。
研究了压缩域视频拷贝检测算法,提出了一种基于I帧DC系数和AC系数特征的两级匹配视频拷贝检测算法。该算法首先计算视频I帧分块的DC系数平均值,然后按照希尔伯特曲线顺序构造DC系数特征哈希值并对参考视频的特征建立倒排索引,采用投票策略选出与查询视频匹配的候选视频集合。最后利用视频I帧分块的AC系数特征哈希值进行二级匹配得到结果。实验表明该算法查全率为88.6%,查准率为87.96%,并且具有更高的运行效率。
研究了基于镜头分割的关键帧提取算法,实现了一种融合HSV颜色直方图和梯度幅值直方图的镜头切换检测算法,并提出了基于累积直方图差的关键帧提取方法。
研究了基于全局特征和局部特征的视频拷贝检测算法,为了减少算法运算量,视频的全局特征采用HSV颜色直方图和梯度幅值直方图。同时,从匹配速度、图像模糊变换、光照变化、视角变化、缩放和旋转变化等角度研究了五种局部特征算法(SIFT、SURF、ORB、BRISK、AKAZE)的性能,结果表明AKAZE算法综合性能最优。从而提出了一种基于颜色和梯度信息全局特征、采用局部特征AKAZE算法的多层次级联式拷贝检测方法。实验表明该算法查全率为96.80%,查准率为97.95%,同时存在着检测时间过高的不足。
为了提高视频拷贝检测的速度,提出了一种基于全局特征视频词袋的快速视频拷贝检测算法。该算法利用全局Gist特征和PHOG特征在场景分类中的优势,对视频以帧为单位,将提取的Gist特征和PHOG特征进行特征组合,通过聚类创建参考视频库的视频词袋,然后用视频词袋中的单词表示查询视频和参考视频,进行序列匹配得到结果。实验表明该算法查全率为87.8%,查准率为100%,算法的运行效率得到大大改善。
研究了压缩域视频拷贝检测算法,提出了一种基于I帧DC系数和AC系数特征的两级匹配视频拷贝检测算法。该算法首先计算视频I帧分块的DC系数平均值,然后按照希尔伯特曲线顺序构造DC系数特征哈希值并对参考视频的特征建立倒排索引,采用投票策略选出与查询视频匹配的候选视频集合。最后利用视频I帧分块的AC系数特征哈希值进行二级匹配得到结果。实验表明该算法查全率为88.6%,查准率为87.96%,并且具有更高的运行效率。