【摘 要】
:
视频中人的行为分析是当前计算机视觉的一个热点研究课题。近来,其应用于商业化的进程不断推进,该研究领域中所涉及的问题一定还将被不断深入。特别随着微软公司kinect的到来,视
论文部分内容阅读
视频中人的行为分析是当前计算机视觉的一个热点研究课题。近来,其应用于商业化的进程不断推进,该研究领域中所涉及的问题一定还将被不断深入。特别随着微软公司kinect的到来,视频行为分析的应用已初见端倪,但离广泛普及还有一定距离。由于该研究领域涉及到计算机视觉的若干技术,这些技术目前都还存在一定的技术瓶颈,特别是对环境有较大的敏感度。这也成为了本文研究的一个直接动力。为此,选取了视频行为分析当中两个重点问题加以研究。首先,本文是基于可分割和识别的行为主体为研究对象,即可以从视频帧中首先定位出人体区域,因此研究的两个问题分别是:人体的检测与定位;人体的行为识别。人体区域的检测与分割是基于可分割行为目标研究中一个总的前提,我们需要在视频区域中实现人体区域的分割。为此,我们在基于传统运动区域检测算法的基础上,在已经检测出的候选运动区域中,设计出了一套新的目标检测算法,用基于Hough投票的方法,将目标区域分割出。在本文所用的基于Hough投票的方法中,我们创新性地利用目标内部的上下文特征关联规则,增强了目标特征表达的可靠性。人体的行为识别是在以检测出的人体目标区域基础上进行的。在本文中,我们主要研究基于多层次的目标检测算法,利用隐马尔科夫模型,在行为特征层和行为标签层之间隐式地搭建了一个语义层次:人体原型姿态描述层。与将整个目标区域当做特征表达对象不同,本文的研究着重于分析目标区域内部结构信息,提取出人体的姿态信息,这种姿态信息的语义层次要高于行为特征层,但是要低于最终的行为标签层。本文的创新工作也主要集中于如何利用随机模型连接这三个层次,将其合理地运用于视频行为分析当中。最后,为了验证本文算法的有效性,在若干个相关数据库上进行了充分的实验。实验结果表明,与之前的算法相比,本文提出的算法有更好的适应复杂环境的能力。
其他文献
Gnutella网络是典型的完全无中心的文件共享的P2P网络,近年来发展非常迅速。但是,Gnutella网络的可扩展性差,大量的冗余消息加重了网络负载,这些缺陷限制了Gnutella网络的进
语音信号和视觉信号是多媒体交互信息的主要载体.人们对语音、图像的处理技术已经有了比较深入的研究,但是对于语音和图像之间的内在关系的研究却还不够深入.作为综合考虑语
利用遗留系统来开发新系统,已成为当前软件工程研究的一个重要方向。软件再工程正是在这种情况下已越来越显示出其重要作用。软件再工程提供了一条有效利用遗产系统的现实可行
空中交通指挥系统(ATM)是保证航空飞行安全、高效的关键系统,它由复杂的硬件系统和软件系统组成,如何有效的监视并控制这些硬件、软件系统的运行状态是现代空管技术中的重要
需求工程是近些年来兴起的软件工程研究的子领域,人们对软件工程中的需求分析及建模技术的认识越来越重视.需求分析与建模技术在现阶段的研究中虽然各自有所发展,但技术都是
互联网、集群和多媒体技术的发展,使多媒体数据日益成为下一代互联网信息数据的代表。多媒体信息压缩的技术是多媒体通信领域的关键技术,因此编码标准MPEG-4也成为了研究的焦
随着网络技术的飞速发展,网络安全问题日益突出,防火墙是目前广泛使用的一种网络安全技术.由于当前基于Windows的包过滤防火墙一般建立在网络层之上,不能拦截所有数据包.另外
自动控制作为计算机的重要应用领域之一,对国民经济的发展起了极大的促进作用。通过智能控制,不仅大量节省了人力物力和成本,提高了劳动生产率,同时还提高了产品质量。 本课题研
工作流管理系统WfMS(Workflow Management System)是近年来随着Internet和Intranet的急剧推广而快速发展的软件系统之一。该系统的主要目标是通过调用有关信息资源与人力资源来协调业务流程中的各个环节,使之按照一定的顺序依次进行,从而实现业务流程的自动化。 目前国内外虽然已经有了很多工作流管理系统的产品,但是它们大部分不能有效的处理工作流中的异常情况,极大的
随着现代社会信息化、智能化,网络化的发展,嵌入式系统作为后PC时代和网络时代的新秀,正在大放异彩.而智能语音技术的不断成熟和完善,也给嵌入式的发展带来无限的活力.由于语