面向智能仓储的大类物体识别与检索方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:sikongshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
仓储管理是动车高铁装配、检修作业线上非常重要的环节,在存取物料过程中快速获取物料的编号、名称等信息可以大大减少仓库值守所需的人力与物力。大类物体识别与检索主要是根据相机拍摄到的图像得到零配件所属的种类、编号等信息。本文通过分析实际应用场景下的零配件特点,研究面向智能仓储的大类物体识别与检索方法,主要工作如下:针对动车检修实际工业场景中,零配件种类较多,类内差距大,同时存在同属于某一大类别但是细节上存在差异的细粒度类别划分情况。本文提出了基于多注意力融合的分级大类物体识别算法,该算法通过SE(Squeeze-and-Excitation)模块的注意力机制对不同层次的特征进行融合,建立多层级结构。首先将细粒度物体看作一个大类别,利用粗粒度识别网络进行大类别识别,减少细粒度物体对识别精度的影响,然后通过注意力机制,分别针对每一个需要细分类的大类别计算出对其分类贡献比较大的特征通道,并融合多个层级的特征作为细分类任务的基础,从而提高识别的准确度。本文通过实验证明了该算法在本文构建的零配件数据库上可以得到较好的识别结果,识别准确率为97.84%,相比单级网络提高6.68%。针对全局特征缺少几何不变性,局部特征缺少几何空间的限制的问题,本文提出采用局部特征与全局特征融合的方法对物体进行检索。本文提出一个基于启发式的分层大类物体检索方法,考虑先验知识的加入可以对数据库进行初步筛选,提高检索速度与检索准确性的问题。本文提出采用局部特征与全局特征融合的方法,克服了单纯全局特征缺少几何不变性而单纯局部特征缺少几何空间的限制的缺点,提高检索的准确度。通过在零配件数据库上的实验对比,返回Top10作为结果时,融合特征的mAP值为0.967,相比于局部特征与全局特征均有提高。而基于启发式的分层大类物体检索方法,充分利用了取料人员的先验知识,结合数据库本身的分布特性,加快了检索速度,提高了系统使用的用户体验。实验结果表明,多层检索在保证相当的检索准确度的情况下,检索速度较单层检索提高了54%。本论文研究依托于实验室重点横向项目,搭建了实际系统,包括图像采集模块、数据预处理模块、算法及系统的软件实现及结果分析等模块,验证上述理论算法的有效性。综上所述,本文结合实际的动车检修工业场景,面向智能仓储,提出了多注意力融合的分级大类物体识别算法和基于启发式的分层大类物体检索方法,并在实际系统上验证了两种方法的有效性。
其他文献
肩周炎是一组运动障碍类疾病,主要引起肩关节周围的疼痛,导致肩关节运动功能受限,严重的影响患者的生活质量,目前主要的治疗方式是单一的治疗,但以功能锻炼为主的综合治疗能更有效
<正>糖尿病发病率高,发病机制复杂,并发症多。患者发生糖尿病后,症状表现复杂多样,所以,以一方一药解决糖尿病的所有问题,是不符合实际的。多数糖尿病患者疗效满意,但也有少
会议
<正>目的:目的:探讨抗生素骨水泥在糖尿病足的治疗中的临床疗效方法:资料与方法:2016年7月至2019年2月治疗29例糖尿病足患者,其中男性20例,女性9例,年龄38~74(48.6±11.2)岁,
会议
<正> 中药材市场变化大,除有周期性的年波动外,一年内也存在着十分明显的季节周期性变化。即某种中药材产新时往往货丰价廉,以后随着时间的推移,价格逐渐提高,直至达到高峰。
分析了非线性扩散、基于整体变分方法的ROF模型以及矢量图像耦合技术的原理,比较了这些扩散、去噪模型的优缺点。根据矢量图像耦合思想将TV流运用到矢量图像扩散中,并参考ROF模型逼近项变分模型的优点,提出了基于非线性扩散、ROF模型和矢量图像耦合原理的改进TV流矢量图像耦合扩散模型,目地是在彩色图像中,去噪同时更好地保留图像轮廓、边缘等重要信息。实验对比分析了改进前后模型的去噪效果,并分析了改进模型下
鉴于对极约束是立体图像中完全不依赖于场景的重要几何约束,因此在特征匹配中起着很重要的作用,而且由于同形映射描述了平面场景的立体图像之间的对应关系,故大量文献中利用它对平面场景的立体图像对进行特征匹配。为了提高立体图像匹配精度和速度,提出了一种改进的场景无关约束下的特征匹配算法,该算法针对用对极约束和同形映射来进行曲面场景匹配的过程中同形估计容易出现降阶的情况,通过引入区域面积检测法来避免降阶情况的