论文部分内容阅读
仓储管理是动车高铁装配、检修作业线上非常重要的环节,在存取物料过程中快速获取物料的编号、名称等信息可以大大减少仓库值守所需的人力与物力。大类物体识别与检索主要是根据相机拍摄到的图像得到零配件所属的种类、编号等信息。本文通过分析实际应用场景下的零配件特点,研究面向智能仓储的大类物体识别与检索方法,主要工作如下:针对动车检修实际工业场景中,零配件种类较多,类内差距大,同时存在同属于某一大类别但是细节上存在差异的细粒度类别划分情况。本文提出了基于多注意力融合的分级大类物体识别算法,该算法通过SE(Squeeze-and-Excitation)模块的注意力机制对不同层次的特征进行融合,建立多层级结构。首先将细粒度物体看作一个大类别,利用粗粒度识别网络进行大类别识别,减少细粒度物体对识别精度的影响,然后通过注意力机制,分别针对每一个需要细分类的大类别计算出对其分类贡献比较大的特征通道,并融合多个层级的特征作为细分类任务的基础,从而提高识别的准确度。本文通过实验证明了该算法在本文构建的零配件数据库上可以得到较好的识别结果,识别准确率为97.84%,相比单级网络提高6.68%。针对全局特征缺少几何不变性,局部特征缺少几何空间的限制的问题,本文提出采用局部特征与全局特征融合的方法对物体进行检索。本文提出一个基于启发式的分层大类物体检索方法,考虑先验知识的加入可以对数据库进行初步筛选,提高检索速度与检索准确性的问题。本文提出采用局部特征与全局特征融合的方法,克服了单纯全局特征缺少几何不变性而单纯局部特征缺少几何空间的限制的缺点,提高检索的准确度。通过在零配件数据库上的实验对比,返回Top10作为结果时,融合特征的mAP值为0.967,相比于局部特征与全局特征均有提高。而基于启发式的分层大类物体检索方法,充分利用了取料人员的先验知识,结合数据库本身的分布特性,加快了检索速度,提高了系统使用的用户体验。实验结果表明,多层检索在保证相当的检索准确度的情况下,检索速度较单层检索提高了54%。本论文研究依托于实验室重点横向项目,搭建了实际系统,包括图像采集模块、数据预处理模块、算法及系统的软件实现及结果分析等模块,验证上述理论算法的有效性。综上所述,本文结合实际的动车检修工业场景,面向智能仓储,提出了多注意力融合的分级大类物体识别算法和基于启发式的分层大类物体检索方法,并在实际系统上验证了两种方法的有效性。