基于改进SSD的小目标检测算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:yuandt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SSD属于经典的单阶段目标检测算法,它通过在不同卷积层上生成六个尺度的特征图来进行预测,但由于其存在浅层特征图的非线性程度不够、缺乏语义信息等问题,同时小目标所含像素少,在经过多次卷积操作后信息丢失严重,从而导致小目标的检测准确率远低于大中尺度的目标。为了解决上述问题,提出了多尺度特征与混合注意力机制融合的策略,即在替换原骨干网络的基础上构建自下而上的下采样路径和自上而下的上采样路径。具体来说,下采样路径使用自注意力机制自适应地增强浅层空间特征和深层语义特征。在上采样路径中,通过融合三个尺度的特征图的局部信息和全局信息,增强深层特征的语义信息,并且引入空间注意力机制和坐标注意力机制丰富待融合特征图的语义信息和位置信息,同时使用自注意力增强模块进一步增强融合特征的表达能力。实验证明,本文提出的改进算法与SSD算法相比,当输入图像大小为512×512时,在PASCAL VOC和HRRSD数据集上达到了84.6%和89.6%的平均精度,分别提高了6.1%和8.8%,对于小尺寸目标的检测效果显著。
其他文献
机械臂作为一种可以代替人工操作进行重复性操作的高度自动化的设备,由于其在各方面的应用日益广泛,人们对机械臂的研究也日益增多。其中,轨迹规划与避障是六自由度机械臂控制的主要研究方向,高效精确且快速平滑的无碰撞规划轨迹对提高作业效率有着重要意义。本文以安诺机器人公司生产的V6PLUS桌面机械臂作为研究对象,基于ROS系统对六自由度机械臂的控制系统、运动学、轨迹规划、避障规划、实物操作进行分析与研究。首
目的 观察枫杨总黄酮对非小细胞肺癌A549细胞的抑制作用,并探讨其可能的作用机制。方法将A549细胞分为对照组和枫杨总黄酮低、中、高剂量组,分别用相应培养基培养,采用CCK-8法检测细胞存活率,流式细胞术检测细胞凋亡和细胞周期,Western blot检测凋亡相关蛋白Fas、Bax、Bcl-2、Cleaved Caspase-3及周期相关蛋白Cyclin D1、P27表达。结果 与对照组比较,枫杨
综述了重金属、石油烃及重金属-石油烃复合污染的危害,分析总结了土壤重金属-石油烃复合污染植物修复技术的原理、适用范围、优缺点及应用,旨在为重金属-石油烃复合污染土壤植物修复提供科学参考。
学位
化工行业的蓬勃发展带动了危险品需求量、供应量和运输量的不断增加。危险品由于其自身的理化性质,具有易燃爆、毒性等危险特性,在道路运输过程中成为一个移动的危险源,危险品道路运输路径评估和选择决策显得尤为重要。此外,一旦在选择的运输路径上发生事故,就会对周边的人员、财物和环境造成巨大的影响,事故应急资源调度决策就可以发挥极好的作用来缩短应急响应时间。因此,文中做两步决策来保障危险品道路运输的可持续发展和
学位
目的:探讨及比较腹腔镜及开腹修补术对胃溃疡穿孔患者术后胃肠功能及肠黏膜屏障的影响。方法:选取2019年1月-2021年12月的100例胃溃疡穿孔手术患者为研究对象,将其随机分为对照组和观察组,各50例。对照组进行开腹胃穿孔修补术治疗,观察组则进行腹腔镜胃穿孔修补术治疗。比较两组术后的胃肠功能恢复时间、并发症发生率、手术前后的胃肠激素[血管活性肠肽(VIP)、胃泌素(GAS)及胃动素(MTL)]及肠
目的 探讨超声造影时间-强度曲线在宫腔占位性病变良恶性诊断中的应用。资料与方法 回顾性分析2018年12月—2019年12月北京大学人民医院35例宫腔内占位性病灶的妇科超声造影检查资料。依据宫腔镜手术病理结果分为恶性组17例和良性组18例。对两组患者病灶绘制时间-强度曲线,分析造影剂到达时间、造影剂达峰时间、峰值强度以及造影的上升斜率,以上4项诊断指标通过同一患者宫腔病灶与正常肌层的数值比值进行比
马克思世界历史理论以唯物史观及科学的实践观为方法论指导,将“现实的个人”作为世界历史理论的主体,揭示了各民族国家如何在生产力与交往关系的矛盾运动中由独立封闭走向普遍交往的发展过程。马克思世界历史理论不仅是当代全球化理论的思想基础,有力回击了“逆全球化”思潮,也为新时代构建人类命运共同体思想提供了理论借鉴,有利于进一步构建以国内国际双循环相互促进的新发展格局。当前我国正在向第二个百年奋斗目标迈进,所
针对铝材表面缺陷检测精度不高,容易漏检的问题,提出基于改进YOLOv4的缺陷检测方法。在CSPResblock模块中引入注意力机制SE模块,赋予各个通道相应的权重,加强网络对于重要信息的训练,提升网络的特征提取能力;改进SPP模块,使用不同宽高比的池化核,有利于保留更多的短边信息,提高网络对大宽高比缺陷的检测能力;对PANet结构进行改进,在对应特征层级上拼接输入信息,主要融合主干网络的三层输出,