基于卷积神经网络的RGB-D物体识别研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:sssss1O
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机软件及硬件的发展,尤其是GPU的广泛使用极大的提升了计算机的计算能力,这使得沉寂了许多年的以卷积神经网络(Convolutional Neural Networks,简写为CNNs)为代表的深度学习模型在计算机视觉领域各种任务上获得了前所未有的成功。同时,人们的物质生活也得到了极大的丰富,智能手机、智能家电、聊天机器人等在人们的日常生活中越来越常见,物体识别技术已经被广泛的应用在这些设备上用于实现人机交互。然而,物体识别并不是一个简单的任务,因为同类的物体存在类内多样性,而且不同类物体间也存在一定程度的类间相似性,仅仅依靠RGB图像实现准确的物体识别仍然面临很大的挑战。近年来,价格低廉的RGB-D设备(比如微软的Kinect)的出现使得深度图像的获取更加容易,深度图像作为一种辅助信息在一定程度上能降低图像识别的难度,已经成为科学家们研究的热点。图像数据作为信息传递的一种重要载体,在人机交互的过程中有着不可或缺的作用。而在人机交互中手持物体又占据着绝大部分,因此本文的工作主要对手持物体识别做一些研究。本文的主要工作包括以下几个部分:(1)采用深度学习的方法进行手持物体识别,并在此基础上提出两种基于RGB图像和Depth图像的多模态特征融合方法:高层语义特征融合和基于gate机制的特征融合。本文提出的方法可以使神经网络自动学习两种模态特征对于最终识别结果的重要程度,从而实现两种特征的相辅相成,更有效的融合特征。(2)采用小样本学习的方式进行手持物体识别,并在此基础上提出基于多模态特征融合的小样本学习方法,该方法引入深度图像作为辅助信息,能有效提升小样本学习能力,获得更好的性能。(3)采集并制作由40类生活中常见物体组成的手持物体识别数据集HOD-40,包括原始图像、分割图像与物体的bounding box,其中每一帧图像不仅有常见的RGB图像还包含与之对应的深度图像。
其他文献
对山东蒙阴金刚石中的稀有气体及其地质成因进行了系统的研究。首先,进行了阴极发光、DiamondView、BSE等方面的研究,发现山东蒙阴金刚石多成熔蚀表面,呈现浑圆状外观,说明该地金刚石经历过较强烈的熔蚀作用,晶体上发育的熔蚀沟也证明了这一点。结合内部结构观察,大部分山东蒙阴金刚石内部出现环带结构,说明其层状生长机制,常见的类型有简单八面体生长环带、复杂八面体生长带、―似玛瑙状‖复杂生长环带等,其
党的十八大以来,习近平总书记从确保党和国家的事业生生不息、后继有人的战略高度出发,在多个场合都强调“家庭、家教、家风”的重要性,希望国人重视家庭建设、弘扬传统家庭美德,形成优良家风,用优良家风教育引导青少年成长成才。优良家风作为中国传统文化的重要组成部分,从古至今在个人品德的形成、家庭教育、社会治理等方面都发挥着重要作用。随着经济全球化的发展,带动了文化的全球化,外来文化冲击着我国的家风文化,削弱
近年来,国家出台一系列健康政策,标志着我国开始推动国家健康战略。以健康为中心,以医疗服务机构为主体,以“防大病、管慢病、促健康”为目标,构建健康管理联合体,是转变健康
近年来,金属配合物的广泛研究在配位化学和有机金属化学领域受到越来越多的关注。随着现代配位化学的迅猛发展,金属配合物的合成及其性质研究成为热门研究课题。Salamo配体具有良好的稳定性和柔曲性,不易发生水解,易与金属盐发生配位反应形成稳定的金属配合物。Salamo型配合物逐渐从单核、双核、多核演变为杂金属-多核配合物,至今已制备出了多种结构新颖的金属配合物。近年来,Salamo金属配合物在生物体系、
随着时间和科技的发展,近年来,国内外矿产资源形势日益严峻,对深部隐伏矿体的寻找也更为迫切,三维成矿预测技术方法已日渐成为研究工作的重点。华山-太峪口地区位于我国重要的金成矿带小秦岭金矿地区。但是,随着社会的发展,近年来矿田被大力开采,该地区金矿田的地表及浅部的矿产资源已近枯竭,许多金矿的采金量也严重萎缩。为此,该地区已经被列入为国土资源部的危机矿山接替资源的勘查重点项目区之一。作为小秦岭成矿带的重
激光是基于受激辐射和光放大的原理而产生的,自1917年提出“受激辐射”概念到第一台激光器问世,激光因其极高的光束质量和稳定的特性受到研究人员的关注,激光技术被广泛的应用于人类生产以及生活当中的各个领域,而其中自由空间激光通信技术更是激光应用领域内一直被世界各国研究者所热衷研究的技术。以激光为载体的通信技术具有数据传输效率高、抗干扰能力强等优点。但是大气中大气湍流带来的湍流效应却会影响激光通信的效率
目的:酸敏感离子通道(Acid-sensing ion channels,ASICs)是一类能够与胞外质子结合从而开放的阳离子通道,属于上皮钠离子/退化蛋白(Epithelial sodium channel/degenerin,ENa C/
群智感知系统是随着大数据时代的到来而产生的一项数据收集技术。随着智能手机的普及以及智能手机计算能力的提高,智能手机用户通过互联网协同工作。智能手机中的各种传感器
高施肥用量导致温室种植土壤理化性质恶化,土壤盐渍化问题突出,严重影响温室植物的正常栽培管理。因此通过温室试验,以草莓为材料,设置六组不同用量的氮肥、磷肥、钾肥用量:S
时代在发展,社会在进步,城市化发展的脚步也在加快。高层建筑的出现以及桥梁隧道的建设等需要极具规模的建设队伍以及更加成熟的建设技术。除此之外,为了保证人民的生命安全与财产安全,也要求建筑安全人员,能够实时的掌握建筑物的形变情况,以及实时对存在的安全隐患采取相关的解决措施,确保建筑的安全状态,以免造成不必要的生命财产威胁。通过对已经测量得到的实际数据进行数据分析,建立可以对建筑物的形变情况做出准确预测