论文部分内容阅读
目前,目标检测在智能系统(如无人驾驶、机器人、监控监测等)、图像内容分类与检索、辅助医疗(如医学图像病灶提取和分析)等方面都有很大的应用需求。然而,传统的检测算法因为特征设计的局限性很难在性能上再有所突破。而深度学习诞生伊始就被应用到计算机视觉领域,并以明显的优势越来越受到各界研究者们的热爱,短短时间针对目标检测的各类算法和网络模型层出不穷,并以相当快的速度改进着目标检测性能。本文以静态图像的小目标检测为研究对象,通过深入研究和分析目前已提出的各种深度学习的检测网络模型,针对其中的不足进行改进和创新。本文主要的研究内容和创新点如下:1)通过对现已提出的基于深度学习的目标检测网络的原理和性能研究,本文提出一种基于改进Faster R-CNN的小目标检测算法,以提升小物体的检测效果。本文首先就Faster R-CNN网络中小目标检测效果不佳的原因做出了分析,采用了一种联合机制的方法来改善其检测性能。该方法在Faster R-CNN框架中结合了生成对抗模型,利用生成网络先将分辨率较低的小目标特征映射成高分辨率的表达能力更强的特征,再利用网络本身对中大型目标良好的检测能力来达到提升整体检测性能的要求。本文将改进后的网络在Logo数据集上进行了对比性实验,通过实验数据发现,改进后的网络在检测性能方面优于Faster R-CNN,说明改进的方法发挥了作用。2)通过研究发现,只利用简单的高层特征的网络在目标检测性能方面已经很难实现突破。对多种特征进行融合的网络在选取目标预测框时能提供更多的特征信息。因此本文通过在检测网络中融合多尺度特征和全局上下特征来构建新的检测网络模型。本文依旧采用Faster R-CNN作为检测基础框架,通过滚动卷积的方法获取多尺度特征,并且在卷积层顶部采用多个门控递归单元(GRUs)的循环网络来凸显特征图中有用的全局上下文信息,进一步提高目标检测性能。通过在公开的数据集PASCAL VOC 2007和PASCAL VOC 2012上的对比性实验,验证了本文提出方法的有效性。