【摘 要】
:
图像描述任务是融合计算机视觉和自然语言处理和机器学习的综合性问题,是这些年的热点问题与难点问题。虽然近年来研究者在图像描述任务上做了大量的研究工作,推动了该任务的
论文部分内容阅读
图像描述任务是融合计算机视觉和自然语言处理和机器学习的综合性问题,是这些年的热点问题与难点问题。虽然近年来研究者在图像描述任务上做了大量的研究工作,推动了该任务的发展,但是整体效果仍然是差强人意的,图像识别的错误会导致生成句子时的错误累积,图文完全不相关的情况仍然存在,这是因为机器感知能力仍然处于初级阶段。随着技术的进步和发展,希望图像描述任务可以在未来解决更多的现实问题,帮助人类完成更有意义的工作。本文提出结合最新的MASK-RCNN模型获得的特征图作为语言生成模型的输入参考特征,预训练的图像分类模型使用了更好的Res Net-101,特征部分提取Ro IAlign层之后的特征图,并添加了位置特征与面积特征,该部分可以看作BOTTOM-UPATTENTION。描述生成模型使用了注意力机制,通过对注意力机制模型LSTM部分的改进,引用自然语言生成任务的SC-LSTM模型,添加一个DA向量作为语义控制输入,指导模型生成的描述与图像有更强的相关性,DA向量同样通过目标检测模型获取。损失函数使用交叉熵损失与DA向量相关项的和,优化方法使用随机梯度下降算法。最终在AIC中文数据集上取得了不错的效果,BLEU-4获得0.575,METEOR获得0.421,CIDEr获得1.882,ROUGE_L获得0.7。为了获得更多用户的反馈,在微信小程序上提供了可以同时获取图像描述和目标检测结果的调用接口。
其他文献
作为电子产品重要组件的陶瓷电容器需要在更小尺寸上具备更优越、更稳定的性能。本文旨在获得具有高介电常数,低介电损耗以及低电容变化率的钛酸锶钡(BST)基陶瓷电容器材料。本
气象燃气炮作为人影作业中的新型装备,我国的研究处于小范围试验阶段,对燃气炮设计方面的结构参数、装置工作过程、提高和优化燃气炮工作状态方面较少研究。这需要对气象燃气
本文主要讨论了定常自然对流模型的数值求解问题,结合经典有限元方法理论分析及框架,构造了Uzawa算法.首先,用基于混合有限元的Uzawa算法处理自然对流模型.该算法通过Ossen迭代格式处理非线性项,并且,单独对压力进行了迭代,解耦计算了速度,压力,温度.本文给出了相应的稳定性分析,误差估计,以及数值算例.实验结果表明Uzawa算法是有效的.其次,Uzawa方法计算自然对流模型时,发现其中的松弛参
模幂运算是加密和签名系统中最基础的运算之一。由于模幂运算需要很大的计算成本,计算能力受限的用户在短时间内高效地完成复杂模幂运算几乎是不可能的。随着云计算技术的不
超常材料是一种人工亚波长结构,因其拥有常规材料不具备的奇特的电磁特性成为研究热点。变换光学理论的提出为实现超常材料从相位、路径等方面灵活地操控电磁波提供了一个通
目的:本文的目的是评估两种新型P2Y12受体抑制剂(普拉格雷和替格瑞洛)相比氯吡格雷在东亚行经皮冠脉介入治疗(PCI)的急性冠脉综合征(ACS)患者中的疗效和安全性。方法:在Pub Med,Embase,Web of Science和Cochrane中心临床对照试验注册数据库(CENTRAL)中搜索截至2020年3月发表的文章。两名研究者根据纳入和排除标准独立筛选文献,提取数据并评估纳入研究的方法
近年来,我国居民收入大幅度增加,社会经济得到快速发展,人们对生活质量的要求不断提高,旅游产业越发旺盛,城郊乡村旅游也逐步发展兴起。并在旅游产业中展示出旺盛的生命力。中牟县在中原腹地河南省的中部偏东地区,其隶属于郑州市。交通发达,地域面积广阔,湿地、林地面积多,在城郊乡村旅游方面具有良好的条件。但在中牟县城郊乡村旅游的发展过程中,中牟县政府部门和旅游管理部门对中牟县城郊乡村的发展认识不足,所以对中牟
生物质能作为自然界的第四大能源,资源分布广,开发潜力大,环境影响小,由于原料、工艺和设备等诸多方面的原因,生物质成型燃料的生产和利用仍然存在着问题。本文选取棉花秸秆和玉米秸秆为原料研究成型燃料原料的基本性质,首先对生物质秸秆进行工业分析与元素分析;然后研究成型压力、原料粒径和成型颗粒的大小等影响因素对生物质成型燃料物理特性(松弛密度)的影响;在此基础之上,通过不同粒径的成型燃料在不同温度下的燃烧试
木聚糖酶是一类降解木聚糖分子的一类酶系的总称,内切β-1,4木聚糖酶是降解木聚糖的最主要酶,主要由功能、非功能结构域和连接序列等组成。功能结构域又可分为催化结构域(cat
移动机器人智能化最重要的前提之一是具有自主环境感知和行为决策的能力。本文研究了在室内和室外园区环境中移动机器人场景感知及自主行为决策的问题,具体包括三维环境下的位姿跟踪、状态估计、移动目标跟踪以及路径规划。本文首先对移动机器人进行运动学分析,给出了本文所采用的移动机器人结构和硬件信息,并建立运动学模型和控制模型,对于在状态估计和规划控制中的概率应用,也分别给出了移动机器人的里程计运动模型和速度运动