基于三维时空特征和上下文信息的视频分类方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lixiang1989521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频分类主要研究视频中包含的内容,确定与视频相关的几个关键主题。行为识别的主要目标是判断一段视频中人的行为类别,因此行为识别可看作视频分类的子领域。视频分类在视频推荐,智能监控以及人机交互等领域有着广泛的应用前景。随着互联网和多媒体技术的发展,视频数据的规模日益增大,内容也更加复杂,基于传统方案的识别方法遇到了极大的困难。随着深度学习技术的不断发展,深度网络为解决大规模视频分类问题提供了新的思路和方法。深度学习技术的应用使视频分类任务进入了新的阶段,视频分类的精度不断提高,视频分类也由简单场景下的行为识别逐渐发展成大规模多标签的通用视频分类任务。本文主要研究基于视觉的视频分类和行为识别方法,主要对从视频数据中提取出的数据帧序列进行处理和分类,不考虑其它的视频数据信息。提出了基于三维时空特征和上下文门控的视频分类方法,进一步引入了标签平滑和专家混合模型用于视频分类。在行为识别数据集上对所提出的方法做了分析和实验验证,最后对视频分类任务的发展以及研究方向做了展望。本文的主要内容包括:1.提出基于三维时空特征和上下文门控的视频分类方法。三维卷积操作可以直接提取视频的时间和空间信息,而残差结构引入的恒等映射则可以使网络更易优化。网络利用基于注意力机制的上下文门控单元可以重新校准输入的不同视觉激活,捕捉深度特征之间的相互依赖关系。获得了与输出具有显著性关联的表征信息,提升了模型的判别能力。最后在行为识别数据集UCF101和HMDB51上对本文所提出的方法进行实验,证明了所提出方法的有效性。2.提出基于三维时空特征和标签平滑的视频分类方法。利用标签平滑函数修正视频数据的标签,在训练过程中,网络学习了错误标签的损失,增强了模型的学习能力。标签平滑技术对网络的损失函数产生了正则化的效果,可以缓解网络过拟合问题。实验证明了标签平滑技术的引入提高了网络对视频的分类精度。3.提出基于三维时空特征和专家混合模型的视频分类方法。专家混合模型通过使用多个专家模型学习数据的特定模式,利用一个可学习的门控网络整合所有专家模型的预测结果。不同专家模型可以相互补偿其它专家模型造成的误差,最终得到一个泛化性能更强的混合模型。最后在行为识别数据集上进行实验,进一步讨论分析了专家混合模型的有效性。
其他文献
近年来,全国城市间房价增长从“单边上涨”变为“有涨有跌”,呈现明显的分化趋势。同时,政府频繁地实施房地产调控政策干预住房市场。对于城市间房价增长分化现象,已有文献主要围绕供求(收入、人口、就业、土地供给和房企投资)、预期以及政策三个方面解释城市间房价波动的异质性。本文尝试将房价增长分化的影响因素拓展到政策不确定性领域,为研究房价增长分化机制提供新的研究角度,并尝试分析政策不确定性影响房价增长分化的
耕地资源安全对国家粮食安全具有重要影响,科学、准确和全面认识耕地资源质量状况是进行耕地资源管理的核心和关键,而土地整治作为国家层面的一项战略部署,是保护耕地资源和保障粮食安全的有益实践。因此,土地整治区耕地质量评价有利于及时查清土地整治后耕地质量状况、监测土地整治成效和推进高标准农田建设等工作,有利于促进耕地数量、质量、生态“三位一体”综合保护,从而实现保障国家粮食安全的目标。本文从耕地地力、空间
党的十八大提出了“创新、协调、绿色、开放、共享”为主的五大发展理念,明确要将科技创新摆在国家发展全局的核心位置,实施创新驱动发展战略。在经济脱虚向实的倡导下,普惠金融也在包容创新的理念下应运而生,P2P网络借贷作为普惠金融的重要力量为长尾群体“融资难”困境提供切实可行的解决途径。但由于我国P2P平台出险问题防范不到位、退出机制难以建立,监管措施多次出台却收效甚微,P2P市场险象环生。因此,如何杜绝
据文献资料可知,沧浪亭园区建于北宋庆历五年,在两宋时期一直作为私家园墅存在,元明时期为僧侣所有,荒废多年。清康熙年间开始重建,经过十次新建与修葺,沧浪亭园区于同治年间形成今日格局。后历经民国战乱,园区破败不堪,在新中国成立后得到修建,恢复旧观。清至民国时期的沧浪亭主要具备教育和政治两种功能,是苏州地方政治、文化重任的担当者,对研究苏州历史有重要意义。目前,沧浪亭园区保护利用现状总体较好,文物建筑保
电影作为我们日常生活中重要的娱乐方式,在给我们带来欢乐的同时也带来极大的经济效益,伴随电影而生的影评本是观众们茶余饭后的谈资,但在互联网技术普及的今天,电影的影评往往决定着电影的生命。正是因为影评对电影票房的决定性影响,许多电影业相关网站都有电影点评和打分功能,但是因为每个网站的打分标准不一导致得分仅仅能在一定程度上体现电影质量,虽然可以满足辅助观众购票的需求,但想要为电影发行方和放映方提供决策依
旅游产业是国民经济发展战略性支柱产业之一,旅游公共服务是保障旅游活动顺利进行的内在需求,贯穿于旅游活动的始终,因此提供高质量旅游公共服务,健全旅游公共服务体系具有重要的现实意义。江苏省作为长三角区域的重要城市,自然和人文旅游资源优厚,具备发展旅游业的天然优势。与产业高速发展、旅游对经济和就业贡献度的不断提高不相适应,江苏省存在着旅游公共服务体系发展相对群众需要滞后、供给结构单一化、服务水平区域不均
檀香醇(santalol)因其独特的香味和特性,在化妆品行业及医疗保健行业有着广泛的应用,且生物安全性良好。需求的增加导致檀香萜油的价格十分高昂,开发微生物生物炼制生产檀香
平面拟齐次和半拟齐次系统在理论和实际问题中均有重要的应用。本文主要研究一类平面拟齐次多项式微分系统的极限环分支以及平面二、三次半拟齐次系统的极限环和全局相图。全文分为五章。第一章主要介绍近年来国内外对于平面多项式微分系统,尤其是拟齐次系统和半拟齐次系统的可积性、标准型、极限环、全局相图等问题的研究现状。第二章介绍了平面拟齐次和半拟齐次系统的基本概念、阿贝尔积分、吹胀技巧、庞加莱紧致化以及本文要用到
内埋式的弹舱是现代战斗机设计必不可少的一项重要技术,內埋弹舱可以满足现代战争中对战斗机提出的多种要求,如:隐身、超声速飞行等。但是內埋弹舱又带来了一些新的问题,其内部流场十分复杂,存在着流动的分离、剪切层运动、漩涡产生与发展,涡的脱落、涡与波系之间的相互干扰等等;尤其是在超声速的条件下,弹舱内部会产生激波、自激振荡等强烈的流动现象。弹舱中的复杂流场变化使弹舱内部产很大的压力脉动和刺耳的噪声,其对武
检察机关是国家的法律监督机关,随着当前司法体制改革的深入、乡镇经济体制和运作机制的变革和集体利益分配的转变,群众生活需求的多元化,导致人民内部矛盾凸显,使基层乡镇聚