论文部分内容阅读
电视广告检测对于减少和杜绝违法广告等有重要意义.目前常见的检测方法主要是基于音频信号分析的,其准确性、灵活性不太高.通过分析广告的两个基本特点:镜头切换比较频繁和经常突显商标信息,进行了初步的检测研究.
镜头切换检测是视频分析的基础与前提.首先对视频的各相邻帧进行直方图差分,获得直方图差分曲线.再对剪切、消融、淡入淡出和划变这四种常见的镜头切换方式进行特征分析和逐一识别,从而实现了镜头切换检测并获得镜头切换频率.通过C均值聚类获得一个合适的广告和非广告的分类阈值.镜头切换频率高于此阈值的初步判定为广告,否则判定为非广告.对103个视频节目独立地进行测试,获得了89-72﹪的总正确率.
对于镜头切换频率很低的广告,通过文本检测的方法进行广告商标信息的检测,进一步提高分类的正确率.Sobel等边缘检测的方法可以检测出文本区域,但是对背景非常敏感.而采用最大梯度差分的方法,不仅可以有效地检测出文本区域,而且对复杂的背景并不敏感.利用种子填充法、投影法等几种方法均可获得文本块的位置,将同一行相邻的小文本块进行合并,最后根据文本块的大小、面积、像素比例等几何特征进行过滤,将虚假的文本块去除掉.对于100帧测试图像,获得了79.18﹪的总正确率.
综合上述理论和算法,初步实现了一个视频广告检测系统.对每一帧图像与相应的灰度直方图进行显示,检测出商标文本信息并在图像中标注出来.绘制直方图差分曲线的同时,完成镜头切换检测.对于22992帧约15分钟的视频序列,通过滑动窗口进行连续检测,获得了83.32﹪的总正确率.结果表明上述算法可以初步满足视频广告检测的要求.对于镜头切换频率和商标信息条件都不满足的视频,还需要结合其他的方法进行判定,这是今后进一步的工作.