基于图文检索的多模态学习算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fspdgx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,不同模态类型的数据比如文本、图像、视频、音频等在互联网上飞速增长。这些多模态数据从多个不同的角度描述着同一个事件,其中的互补信息使人们对事件的认知更加全面。为了更好地利用多模态数据,人们尝试对多模态数据进行建模处理,各种行之有效的多模态学习算法随之被提出,并涌现出了很多热门的多模态数据研究领域,比如跨模态检索等。目前在多模态深度学习中存在的问题是:多模态数据存在着噪声标签或者标签缺失的情况,且人工验证代价高昂,这样迫切需要可以有效利用噪声标签进行多模态学习的方法;另外,现有的多模态数据相关性挖掘方法主要集中在单层次的挖掘,这往往仅能捕获部分的层次关联,这就需要一种更全面的多层次相关性挖掘算法来捕捉不同模态数据间的复杂相关性。因此,本论文重点研究如何利用多模态数据集噪声标签进行有效的多模态学习,以及如何多层次深度挖掘多模态数据相关性并将其应用到跨模态检索系统中。首先,针对多模态数据集存在的噪声标签问题,我们提出了一种噪声标签清洗、预测方法。该方法的网络主体结构包括图像嵌入子网络、文本嵌入子网络、融合网络层、非线性映射层等,并采用弱监督方法,利用多模态数据集中存在的部分准确标签学习从多模态内容特征空间到标签语义空间的映射关系,再用来对噪声数据标签进行清洗与预测,最后为了验证所提网络的有效性,还设计了一个基于多模态数据的分类网络,通过分类结果判断噪声标签的处理效果。实验结果表明,相对于现有方法利用部分准确标签进行微调,提出方法在Pascal Sentence数据集上分类准确率可以提高3.5%左右。接下来,本论文提出了基于多模态数据的多层次相关性挖掘方法MLCM(Multilevel correlation mining),并将其应用到跨模态的检索系统中。通过构建多层次相关性学习网络,在不同模态数据的不同特征层间进行相关性挖掘,弥补以往只在某一层低层特征空间或者高层语义特征空间进行相关性学习的不足。另外,在跨模态检索系统中,我们还利用前面提出的网络学习方法,利用标签信息的语义知识指导模型来进行训练与学习,这样充分挖掘了多模态数据模态间的相关性和模态内的相关性。实验结果表明,与现有算法MCNN相比,提出的方法在Flickr30k数据集上,image retrieval的R@10检索指标提升1.2%左右,Sentence retrieval的R@10检索指标提升2.6%左右。本论文研究并实现的多模态数据标签清洗预测网络及多层次相关性挖掘算法,可广泛应用于多模态数据集的噪声标签处理及跨模态检索系统中。
其他文献
本文阐述了荧光原位杂交技术的基本原理和程序,并对20多年来荧光原位杂交技术的发展做了介绍。总结了原位杂交显带技术,染色体涂染技术等五种FISH衍生技术的特点和应用,并对
博物馆的美术教育,不仅可以提升人们的审美观念和自身素养,也让我们从另一个角度去理解博物馆,从社会教育看博物馆的意义,并阐释如何从美术角度参观博物馆。
前纵梁是汽车前碰撞中的主要吸能部件,其吸能特性和变形模式决定着碰撞过程中车身加速度响应和力的传递路径,对汽车结构耐撞性有显著影响。为了分析研究前纵梁的变形模式和吸
OBE教育模式将传统的“内容为本”的教学范式转换为以“学生为本”,更加注重学习产出及其特定能力的相应提升。OBE教育模式的运用将有助于新闻传播教育更好地实现其培养实践型
<正>国外机场的安检人员一般不通过手工去检查乘客身体,更愿意使用机器。他们并不反复提示你,要从身上掏出钱包、钥匙、硬币,而是依靠安检门的灵敏性能。过安检门的时候,机器
光纤传感器在混凝土结构深层裂缝监测方面具有巨大的工程应用价值。本文详细介绍了所研制开发的混凝土裂缝光纤传感器的原理和结构设计。从三点弯曲混凝土梁的加载试验结果看
【正】 实验文学运动是缅甸文学界二十世纪三十年代发生的一场意义相当深远的运动。它与缅甸革命紧密相关,对现代缅甸文学的发展起了很大作用。它的余波一直影响到今日缅甸文
在科学技术飞速发展的今天,电气设备已经融入各个领域,电气设备故障诊断成为热门话题。本文介绍了电气设备运行中常见的故障种类及模式识别技术,并从技术实践的角度探讨了电
目的研究温针灸治疗腰腿疼痛的临床效果。方法选取本院收治的168例腰腿疼痛患者作为研究对象,按照随机数字表法分为实验组和对照组,各84例。实验组给予温针灸治疗,对照组给予