论文部分内容阅读
随着遥感图像分辨率的提高,从遥感图像中获得的信息变得越来越丰富。遥感图像识别技术在军事导航和环境监测等方面具有重要意义,对遥感图像进行目标检测具有重要的现实意义和应用前景。但是在遥感图像中存在许多的干扰因素,如视角特殊性、背景复杂度高以及小目标问题等,从而对遥感图像物体检测技术提出了更高的要求和挑战。近年来,深度学习在图像分类和识别领域取得了显著成果,引起了众多研究者的关注。尽管与传统方法相比,深度学习方法在检测性能方面具有显著优势,但是由于遥感图像的特殊性,当前遥感图像目标检测算法在检测速度与准确率方面还不能满足大范围自动化应用的要求,检测速率与检测准确度还能有较大的提升。针对以上问题,本文的主要工作与创新点如下:(1)提出了一种基于改进SSD(Single Shot MultiBox Detector)的遥感图像目标检测方法。首先针对SSD基础网络VGG-16参数繁多,计算成本高的问题,提出使用inception-v2作为SSD模型中的基础网络,以减少特征提取过程中花费的时间,加速网络训练。然后,针对SSD在多尺度目标检测中存在小目标检测效果不好的现象,采用上采样与Concat操作的方式将inception-v2中的Mixed 3c层、Mixed 4c层与Mixed 5c层进行通道连接与特征融合,从而使低层特征语义信息与高层特征语义相结合,提高低层网络提取特征的能力。最后针对SSD在训练过程中出现的正负样本不平衡的问题,本文提出采用Focal Loss解决这一问题,使得SSD网络在训练过程中聚焦于难分类的样本,加速网络收敛。在公开的三个遥感图像数据集NWPU-VHR、UCAS-AOD以及RSOD上进行了对比实验,与改进前的SSD相比,在检测速度匹配的同时平均精确率分别提高了5.4%、6.1%以及11.6%。(2)提出了一种基于改进Faster R-CNN的遥感图像目标检测方法。针对遥感图像中小、中型目标所占比例较大的特点,通过对Faster R-CNN的检测性能分析,首先,提出在Faster R-CNN网络结构中增加Conv2 2层、Conv3 3层、Conv4 3层作为RoI池化层的输入,RoI池化层的输入由之前的Conv5 3一层增加为四层,池化后的输出通过Concat操作进行特征融合后作为用于预测的最终特征图。其次,通过改变Faster R-CNN中anchors的尺度来匹配遥感图像中目标的尺度大小,anchors的数目由之前的9个变为15个。在NWPU-VHR、UCAS-AOD以及RSOD数据集上的平均精确率比改进前的Faster R-CNN分别提升了2.5%、2.7%以及3.6%。