面向语义理解的行为识别研究

来源 :中国科学院大学(中国科学院西安光学精密机械研究所) | 被引量 : 0次 | 上传用户：abc262648312

【摘要】

：

随着网络的蓬勃发展和监控设备的广泛普及,有限的人力资源渐渐难以应对海量的影像数据。所以,越来越多的人期望通过行为识别技术,检测和识别图像或视频中人类的姿态、动作和

【作者】

：

赵阳

【出处】

：

中国科学院大学(中国科学院西安光学精密机械研究所)

【发表日期】

：

2019年01期

【关键词】

：

行为识别深度学习面向对象语义解析计算机视觉

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络的蓬勃发展和监控设备的广泛普及,有限的人力资源渐渐难以应对海量的影像数据。所以,越来越多的人期望通过行为识别技术,检测和识别图像或视频中人类的姿态、动作和表情等信息,让计算机可以智能的理解、学习和模仿人类的行为。因此,针对图像和视频数据中的人类行为的识别和理解逐渐成为了计算机视觉领域的一大热点问题。由于人类行为的发生过程中存在着表观形态差异性大、非刚性形变建模困难、局部肢体遮挡严重、以及底层的视觉特征到高层的语义特征之间的语义鸿沟等障碍,导致行为识别技术难以提取到鲁棒而有效的时空表达特征。同时对于有交互的人类行为识别需要对上下文信息和交互环境进行理解,现有算法难以构建具有语义分析和逻辑理解能力的模型。因此,如何构建鲁棒的时空特征表达和有效的语义理解模型,是解决计算机识别人类行为的关键问题。近年来,随着机器学习和计算机视觉等技术的发展,行为识别技术在学术界和工业界都取得了一定的进展,但是仍旧存在着一些问题:1)如何提取鲁棒的局部时空特征是行为识别任务中最基础也是最重要的;2)如何提取时空特征中的上下文信息,构建有效的语义解析模型是行为识别任务的关键;3)如何发掘时空特征之间时序关系,理清人人、人物和群体间的作用模式是提高行为识别可解释性的突破口。针对上述问题,我们从三个方面对视觉影像数据中的行为识别和理解展开了研究,主要的贡献和创新如下:(1)影像数据的视觉重构。由于前人工作较少关注多种影像数据间的互补关系,本文从剔除行为的静态表观冗余,增强行为的空间结构和运动信息表达入手,提出了模拟人脑视觉系统的视频数据结构。针对视频数据中空间结构信息缺失的问题,提出了基于抽样估计和倍乘迭代的多任务视频分割算法,并在此基础上提出了基于轨迹关键点密度的空间深度合成数据;针对静态表观信息冗余和运动信息表达不足的问题,提出了光流数据与空间深度合成数据融合的空间与光流数据结构,降低了静态表观对运动信息的干扰,提升了特征对于时空信息的表达。所提出的算法在主流行为识别数据集上较传统算法提高了大约17%识别精度。(2)多层级语义解析建模。由于底层视觉特征到高层语义信息存在着映射不一致的问题,本文提出了自下而上的多层级语义解析模型。针对行为动作中局部时空特征难表征的问题,提出了基于语义特征和交叉分类的行为识别模型,增强了局部时空特征的语义表达,实现了语义特征的精细化分类;针对长序视频中行为的时序逻辑复杂的问题,提出了基于三维卷积神经网络和循环神经网络结合的时空特征表达与高层语义映射算法,有效地解析了长时序视频中的逻辑关系,提升了行为识别的准确率。所提出的算法在主流行为识别数据集上达到了90%的识别精度。(3)面向对象的行为理解。由于现有工作缺乏从微观动作到宏观行为的逻辑分析,模型对行为发生的解释能力较低,本文提出了基于多层级语义属性检测和识别的行为理解算法。针对基于内容的行为识别可解释性差和易受环境干扰的问题,本文首先建立了室内场景的跌倒检测数据集,为基于姿态估计的行为识别提供了数据支持,同时提取基于多级金字塔策略的表观特征,实现了面向对象的语义属性检测算法,探究了微观动作到宏观行为的发生过程,提高了机器视觉到人类视觉的可解释性。所提出的算法达到了大约90%检测精度,并且实现了35帧每秒的实时检测性能。

其他文献

从外资企业财务KPI指标看其管理会计的深入运用

通过KPI指标可以看出企业近几年的财务业绩和指标的提高。本文对外资企业财务利用KPI指标对企业管理会计的运用进行说明,并阐述企业管理会计的理念。

期刊

外资企业KPI指标管理会计

尺桡骨骨折应用围术期综合护理的效果探讨

目的探讨尺桡骨骨折患者应用围术期综合护理的临床效果。方法 90例尺桡骨骨折患者,随机分为综合组与常规组,各45例。综合组应用围术期综合护理,常规组应用骨科常规护理。比较

期刊

尺桡骨骨折围术期综合护理护理满意度

慢性阻塞性肺疾病支气管舒张试验后肺容量和呼气流量反应的差异

目的:为进一步了解肺功能检测在慢性阻塞性肺疾病(COPD)诊断中的重要性,研究支气管舒张试验后肺容量和呼气流量反应的差异。方法:选择2009年1月1日至2011年1月5日,分别来自大

学位

用力肺活量第一秒用力呼气容积慢性阻塞性肺疾病支气管舒张试验

深圳市大鹏新区白纹伊蚊密度、抗性监测和登革热病毒携带情况研究

目的:1、掌握深圳市大鹏新区白纹伊蚊种群密度、分布、孳生地类型以及季节消长规律,建立新区白纹伊蚊种群本底数据库,为新区白纹伊蚊的可持续性防制及登革热发生、传播和流行的风险评估提供科学参考;2、了解并掌握目前为止大鹏新区白纹伊蚊成蚊野外种群对三类(拟除虫菊酯类、有机磷类和氨基甲酸酯类)常用杀虫剂抗药性现状,为指导现场合理用药,提高化学防治效果提供理论参考;3、掌握新区白纹伊蚊野外种群登革热病毒携带状

学位

白纹伊蚊监测化学杀虫剂抗药性登革热病毒

我国数字版权保护问题及对策研究

本文从明确数字出版、版权和数字版权的概念入手,分析我国数字出版中版权保护存在的问题,并就此提出相关对策和建议。 This article begins with the definition of digital

期刊

数字版权保护问题对策建议

老年结肠癌并发肠梗阻患者围手术期护理探讨

目的对老年结肠癌并发肠梗阻患者围手术期护理效果进行讨论与研究。方法选取2018年1月～2018年12月在本院进行治疗的60例老年结肠癌并发肠梗阻患者,采取随机分配方式将60例患者

期刊

年结肠癌并发肠梗阻患者围手术期护理

绘人智能测验305例分析

绘人试验用于测定小儿智力发展情况,国内国外均已广泛应用。我们于1986年6月在农村幼儿园为305例儿童作了绘人智能测验,现将结果报告如下: 一、方法: 让每个儿童绘制一张完

期刊

显著性差异

软交换在电力通信中的应用探讨

随着社会通信技术的不断发展,软交换技术也在随之发展起来,在未来IP网络逐渐发展演进过程中,将软交换技术同电力通信行业融合起来极为重要。在通信电网的调度自动化以及管理

期刊

软交换技术电力通信应用探讨

1009例婴幼儿先天性心脏病危险因素的病例对照研究

目的探讨母亲围孕期危险因素暴露与婴幼儿先天性心脏病的发病风险。方法病例选择2012年3月1日~2013年10月1日在西京医院经超声心动图检查确诊为先天性心脏病的婴幼儿,对照选

期刊

婴儿心脏病危险因素

中药联合艾灸治疗寒冷性荨麻疹效果分析

目的探讨中药联合艾灸治疗寒冷性荨麻疹患者的临床效果。方法从本院2016年4月-2017年6月收治患者中选取60例寒冷性荨麻疹患者随机分为对照组（n=30,常规西医治疗）、研究组（n=30

期刊

寒冷性荨麻疹艾灸中药治疗

面向语义理解的行为识别研究

其他学术论文