视频场景中的群体目标分析研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:austdqxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉已成为一个非常活跃的研究领域,它涉及信号采集、图像处理、机器学习、模式识别、行为控制甚至认知科学等多门学科,主要研究视频图像序列中目标的检测、跟踪、行为分析与识别等问题。视频中目标检测和跟踪是计算机视觉的一个方向,目前这方面的研究大多数集中在单或多个物体和人的检测和跟踪。多目标检测和跟踪,也往往将检测和跟踪的目标局限在十个以内。随着人口数目的增加、城市化进程的加快、社会活动频繁增加,公共场合正变得越来越拥挤,大型的集会也日渐增多。于是,对群体活动视频监测的要求变得越来越迫切,但是目前很少有研究涉及群体目标检测和分析。针对这个问题,我们做了如下研究工作:首先,本文对运动场和光流场进行了概述。运动场是描述目标运动的矢量,在没有光照影响的情况下,光流场可以用来表示运动场。光流场是指图像亮度模式的表观运动,可以通过添加限制条件来求解光流约束方程来获得。Lucas-Kanade光流法是比较适合群体运动目标检测和分类的一种光流法,本文用此光流法计算光流场。混沌动力学中,拉格朗日方法尝试跟踪运动流中各像素点的运动轨迹,是处理流体的一种方法。由于群体运动目标的高密度性,可以被认作流体,用混沌动力学的方法处理。有限时间李亚普诺夫指数表示相近粒子间的混合和分离性,反映粒子间的分离程度。根据流图,通过计算龙哥库塔方程获得有限时间李亚普诺夫指数图像。文中比较了运用立体插值和三维反距离加权插值算法对结果的影响,得到运算简单三维反距离加权插值算法更适合实时的应用于群体运动目标的检测和分析的结论。根据获得的有限时间李亚普诺夫指数图像,可以获得运动区域。本文提出了一种改进的Bernsen自适应二值化算法获得有限时间李亚普诺夫指数图像的二值图像。然后用形态学的方法获得大概的运动区域。这时的运动区域存在一个问题是:存在一些“空洞”。为了处理这个问题,可以采用Freeman轮廓提取并填充的方法。在运动区域获得后,需要对其进行分析。本文的分析从两方面进行:方向和密度。对于方向分析,用光流场来获得。提出一种改进的K-均值聚类的方法获得的光流场方向图像。由于视频本身质量原因,得到的结果斑驳不堪。又提出一种小轮廓融合算法对上述结果做改进,有效地去除了各种杂质。对于密度分析,本文采用了纹理的方法。灰度共生矩阵分析是一种纹理分析的方法,其特征参数从不同方面描述图像的纹理。其中对比度反映沟纹的清晰程度,纹理的细致程度,可以通过它获得该运动区域的密度信息。根据各个方向不同的密度信息,通过贝叶斯分类,将不同方向的群体运动目标划分为:稀疏、中等和密集。本文各种算法均通过采用C语言并结合Intel OpenCV库实现。将密集群体系统作为混沌系统处理,首先求解FTLE场。求解龙哥库塔方程时采用反距离加权插值算法,并排除FTLE中标识为非混沌系统的点,表示流动的部分。再用形态学方法处理FTLE场图后获得运动区域。然后,对运动目标区域进行方向分析,使用了改进的K-均值聚类的方法,并提出小轮廓融合算法吸收杂质以优化分割结果。接着对运动目标区域进行密度分析,对分割后的各个区域求取GLCM,以对比度为标准获得密度信息。结果表明,提出的算法有效实现了对从多体到群体的运动目标检测和分析,对群体运动目标的研究有一定的探索意义。
其他文献
卫星通信系统在空间传输中易受到干扰影响。研究相应的抗干扰措施可以保证通信的质量。此外任何一个通信链路中,同步都是一个很必须的部分。良好的同步是完成对信号的正确接
网格计算是分布式计算的一种,它是利用互联网或其它专用网络将地理上广泛分布的、异构的、自治的、动态的各类软硬件资源互联起来而整合成的一台虚拟“超级计算机”,它可以为
语音转换是一种改变源说话人的语音个性特征,使之听起来像另外一个我们称为目标说话人的声音的技术。语音转换的基本要求是转换后的语音具有目标说话人的个性特征,但是并不改变
数字音频水印技术已经成为多媒体信息安全研究中一个新的研究热点。本文针对实时性音频水印会经常遇到的D/A和A/D变换问题展开了研究,通过优化音频水印算法,对基于DSP的实时
随着航空产业的飞速发展,航空通信在日常生活和军事应用中占据越来越重要的地位。针对特定干扰环境中的航空无线通信,如何有效的对抗干扰,实现可靠的数据传输是需要重点研究
在信息化社会的今天,移动通信正在以飞快的速度发展着。但是由于信号不可能覆盖到所有的区域,因此就产生了弱信号区和盲区。对于这些区域,我们通常利用了直放站的射频信号功
语种识别是利用计算机对一定长度的语音材料进行处理,判别其所属语言种类的过程,是语音识别的一个重要研究方向。随着经济全球化的不断深入,语种识别在日常生活、国防军事和
随着经济的发展和繁荣,纸币的流通量越来越大,银行或其它金融机构常需要对序列号的信息进行采集用于分类和防伪。本文致力于基于图像处理的纸币序列号自动识别技术的研究,实现了
现代通信、雷达、成像、射电天文、高功率系统等军用和民用领域对天线辐射性能提出越来越高的要求,不仅需要工作在超宽频带内,而且在整个频带内具有稳定的辐射性能。超宽带高增
本文通过对嵌入式Linux系统及其内核、驱动的研究,对嵌入式数字视频监控系统中各模块驱动进行了设计和实现。本文首先对嵌入式Linux驱动做了研究,研究了嵌入式Linux内核,包括