论文部分内容阅读
现代机场是一个复杂的系统,管制员对机场场面活动目标的监视难度不断增加,安全隐患问题越来越明显,因此开发一套机场场面视频监视系统显得尤为重要。目标检测是视频监控的基础模块,直接关系到整个监控系统的整体性能,因此起着至关重要的作用。然而,由于目标遮挡、场景多变、目标和场景颜色相近、目标过小、运动模糊等问题的存在,目标检测一直都是计算机视觉领域的一个研究热点和难点,大量的学者都在研究解决目标检测中的各种问题。近年来深度学习方法逐渐兴起,相比传统目标检测方法而言,深度学习方法能够从目标中学习到更加丰富、更加鲁棒的特征,从而取得了更好的效果,因此学习研究基于深度学习的目标检测算法,然后应用到机场场面监控中去是一项十分有意义并且具有挑战性的工作。本文的主要内容如下:1.研究了基于深度学习的目标检测算法设计思路。对现有的深度学习目标检测算法进行了一个梳理,大致分为两种思路:一种是先通过选择性搜索算法、区域提取网络等方法提取候选区域,然后进行目标检测;另一种是不使用候选区域提取,直接使用单个神经网络输出检测结果。前者检测精度较高;后者在速度上更有优势,适合本课题。2.针对目前在速度和精度都比较好的目标检测算法Single Shot Multi Box Detector(SSD)进行研究,总结出通过改进其基础特征提取网络,来进一步改进该算法的思路。选择了在性能和计算消耗比较合适的三个分类网络Inception V3、Res Net50和Mobile Net与SSD进行融合,分别在精度或速度上比原算法有进一步的提升。3.针对单级目标检测算法中普遍存在的不平衡问题,引入焦点损失改善训练过程;然后介绍并改进Retina Net的网络结构并针对飞机检测任务进行优化;最后通过实验表明改进的检测算法检测精度更高同时检测速度满足实际应用需求。