基于深度卷积神经网络的无人机航拍图像目标检测方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:bianmlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人机航拍图像下的目标检测是近年来计算机视觉领域中的热点问题之一,可广泛应用在农业、物流和智慧城市等领域中。与自然场景的图像相比,无人机航拍图像具有以下特点:分辨率高、背景复杂、拍摄视角多变、目标尺度变化大等。传统的基于手工特征的检测方法已经很难满足精度需求,深度学习技术已经成为了研究的主要方向。本文针对无人机航拍图像下目标的尺度小、背景复杂和全局信息建模展开研究,主要工作及创新点如下:(1)针对无人机航拍图像中存在大量小目标的难点,本文在特征金字塔网络(Feature Pyramid Network,FPN)的基础上提出了一种新的特征融合网络:倒转解码特征金字塔网络(Inverted and Decoded FPN,ID-FPN)。该方法能够对不同层次的特征图进行有效融合,增强语义信息。实验表明ID-FPN可作为独立的特征提取结构应用到现有的检测算法中。使用了 ID-FPN的Faster R-CNN检测算法在无人机航拍数据集VisDrone上对小目标的检测能力得到了提升,较使用FPN结构提高了约1.5%的mAP。(2)引入非局部块(Non-local Block)对图片的全局信息进行建模。一般情况下,全局上下文信息对目标检测任务有很大帮助。但现有的检测算法在检测时对每个目标的检测都是独立的,没有充分考虑目标和目标之间的关系以及全局上下文信息。Non-local Block可以让检测器捕捉目标的上下文信息,有效减少错误分类和漏检。(3)针对背景复杂的问题,本文设计了一种基于注意力机制的目标检测算法(Attention Based Faster R-CNN,AB-Faster-RCNN)。该算法设计了一个基于感受野块(Receptive Field Block,RFB)的注意力机制,并引入了 ID-FPN和Non-local Block模块。注意力机制让卷积神经网络能够去除冗余的背景信息,增强特征的表达能力。实验表明AB-Faster-RCNN在VisDrone数据集上取得了领先检测水平,在mAP上比其它的两阶段检测算法高1.2%。
其他文献
体系是一类综合集成大系统,通过一众具备运行独立性和管理独立性的异构组件系统互联、互通、互操作,从而涌现出单个系统所不具备的能力。由于要素多样、规模庞大、连通复杂,体系面临各式各样的不确定性,韧性则是应对不确定性的能力。面对多任务变化、突发扰动、攻击甚至失效,韧性体系可以凭借特定策略机制进行预测、响应、抵抗、吸收和恢复,进而保持原有效能或产生积极涌现。然而体系韧性的分析、评估与设计面临着诸多挑战,需
随着化石燃料的消耗增加以及日渐加剧的能源危机和温室效应所带来的问题,探索和利用新能源是人类走上新时代的必经之路。近年来,生物柴油因其环保性、可再生性以及可直接用于发动机且拥有比柴油优越的排放性能等优点,被视为最有前景的替代燃料。然而,生物柴油是由多种长链脂肪酸甲酯组成,成分复杂,目前对它的化学反应动力学研究仍然任重而道远。针对目前生物柴油反应动力学以及反应机理研究不充分等问题,本文首先开展生物柴油
与传统的虚拟机相比,容器启动快速、资源占用率更低,在云计算领域受到越来越广泛的应用。然而,容器的安全性和隔离性远不如虚拟机。这种问题的根源在于多个容器会共享同一个操作系统内核以及使用内核提供的统一的系统调用接口。任意容器通过系统调用对内核造成的破坏都有可能影响到其他容器甚至宿主机的正常运行。现有的系统调用过滤方法,主要是基于内核层面的过滤器或是基于用户态的内核,会给容器带来显著的性能开销。如何在增
随着通信技术的不断发展,无线通信技术也获得全新的改变。目前最新出现的无线通信技术标准,指的是数字集群无线通信技术,该技术正广泛应用于社会各地,同时也面临着一些项目风险,比如环境、规划设计、组织结构和技术等方面。总而言之,项目管理的全过程当中或多或少都存在一些风险隐患,因此很有必要进行风险管理,以此推动项目的正常运行。移动通信工程建设项目拥有非常广的涉及范围,跟地方政府和运营商关系非常密切,同时还包
随着高等教育大众化的深入推进,硕士研究生的规模也实现了增长。然而硕士研究生规模量的增长没有带来质的显著提升,从硕士生的学习投入中便可看到硕士教育质量仍有待提升,有不少硕士生的学习投入不足。为此,本研究聚焦于学习投入不足的硕士生,探讨硕士生为什么学习投入不足。本研究运用质的研究方法,采用强度抽样的方式选取了H大学G学院的15名文科硕士生作为研究对象,围绕着学习、科研等方面设置访谈提纲并对15名受访者
车联网技术的发展为人们生活带来诸多便利,但与此同时面临的安全威胁也日益增多。现代汽车网联化使黑客可通过多种手段入侵车载网络,窃取车辆数据甚至远程操控汽车。云平台是车联网“云-管-端”架构的重要组成部分,一旦被黑客入侵,所有与平台连接的智能汽车都将受到威胁。车联网平台作为车联网的核心系统之一,不可避免地继承了通信系统及Web应用原有的脆弱面,但车企通常更关心用户体验而对平台潜在的安全风险关注较少。传
锂离子电池作为新一代清洁绿色的二次电池储能体系,已经成为了目前储能体系的首选。目前商业化的锂离子电池一般采用石墨为负极材料,但其本身的振实密度较低,理论比容量较低(372 mAh g-1),以及过低的嵌锂电位使得电池在循环过程中易沉积锂,产生锂枝晶刺破隔膜从而造成一系列安全隐患。因此,石墨负极已经无法满足人们对高容量、高安全性锂离子电池的需求。基于此,高性能、高安全性的锂离子电池负极材料的改性与研
在数据量不断增长的互联网时代,高校的计算中心不仅存储了比以往更多的数据量,同时也承载了更多的职能。因此,保障数据中心机房的日常安全是极其重要的,尽管机房中装有多路摄像头以及存储设备,但是机房一旦发生一些危害机房安全的异常事件,仍然需要机房监控管理人员从大量的监控数据中人工回看,不仅时间成本高,而且存在安全隐患。为了解决计算中心机房的异常事件检测问题,保障数据中心机房的安全,实现了一个适用于数据中心
存储芯片是我国亟待发展的芯片行业中的一个重要方向,三维相变存储器作为下一代新型存储器的代表,极有可能成为我国在存储芯片领域弯道超车的一个助推剂。相比传统的平面二维相变存储器,三维相变存储器不管是在存储介质还是外围电路方面都有较大的不同。三维相变存储器由于处在横纵交错的crossbar阵列中,因此漏电流是一个非常重要的问题,OTS选通管不管是从兼容性方面还是其本身的器件特性方面都非常适合作为三维相变
背景及目的:能量代谢是细胞维持生命功能的基本生物活动,主要包括糖代谢和脂肪酸代谢,能量代谢途径在T细胞亚群分化中发挥关键作用,也是干预T细胞亚群分化的潜在靶点。不同T细胞亚群的能量代谢途径存在差异:效应性T细胞主要为有氧糖酵解;而调节性T细胞(Regulatory T cells,Treg)、记忆性T细胞(Memory T cell,Tm)和初始T细胞(Naive T cell,TN)主要是脂肪酸