论文部分内容阅读
“问题地图”主要指存在危害国家统一、主权和领土完整,或危害国家安全和利益等情况,以及其他不符合地图管理相关规定的公开地图和地图产品。特别的,本文所指代的“问题地图”限定为如下区域出现绘制错误的现时版电子中国地图:1)阿克赛钦地区;2)藏南地区;3)南海诸岛;4)钓鱼岛、赤尾屿;5)台湾省。“问题地图”损害国家利益,严重违反政治的严肃性、科学的严密性,同时也给人们日常出行、生活等造成了困扰。因此,“问题地图”的排查与审核迫在眉睫。本文针对“问题地图”审核依赖大量人工进行目视判别以及流行的卷积神经网络需要大量的训练样本,提出了一种端到端的小样本场景下基于卷积神经网络的多尺度特征融合自适应智能“问题地图”检测方法。该方法首次将基于卷积神经网络的目标检测算法引入到“问题地图”检测中,采用融合特征的多尺度表达自适应尺度选择机制,实现了“问题地图”五大版图错误的智能识别和标定。进一步的,该方法结合“问题地图”的特点进行优化,在训练样本较少的情况下完成了“问题地图”的智能识别。实验表明,本文算法用于检测“问题地图”的性能远超其它算法,验证了本文方法的有效性。具体的,本文主要研究内容及其相应的研究成果可总结为如下几点:1)本文从数据和算法两个层面提出不平衡样本情况下的样本类别平衡方法,很好的解决了类别不平衡的情况,提高了数据质量。在数据层面,提出“变换过采样”方法,在保证图像主体信息的情况下引入了其它信息,模仿了现实世界各种场景下不同的图像表达方式,帮助算法提高泛化能力。在算法层面,基于数据正负样本比例对损失函数进行调整,进而达到类别平衡。2)本文提出一种融合多个卷积神经网络输出特征的“问题地图”样本挖掘方法。由于目前没有现成的“问题地图”数据集,研究使用卷积神经网络对自然图片进行挖掘,进而得到符合要求的“问题地图”数据集。针对传统卷积神经网络对硬件需要高,单一网络不能够很好的对样本进行分类。提出融合多个不同卷积神经网络输出特征的“问题地图”样本挖掘方法,该算法融合图像多个方面的特征,在降低硬件需求的同时还能够提高卷积神经网络的性能。3)本文针对上述经由卷积神经网络挖掘得到的中国地图数据集,发展出一种数据集质量提升方法。该数据集质量提升方法首先结合不同比例尺地图上检测区域的尺寸虽然会随着比例尺变化而变化,但是检测区域的宽高比不应改变的特点,为不同的检测区域定制了不同宽高比例的标注框,进而得到更加契合“问题地图”识别的数据集标注方式。进一步的,针对上述已标记检测区域的数据集,提出一种小样本场景下的实时数据增强方法。该数据增强方法不需要额外的存储空间,对原始图像添加少量轻微可控的变化,大大增强了样本的表达能力,能够明显提高模型的泛化能力。4)本文提出一种基于卷积神经网络的多尺度自适应“问题地图”智能识别方法。方法首次引入目标检测算法对“问题地图”进行识别,并对流行的目标检测算法进行改进,在传统目标检测网络上融入特征金字塔网络,构建融合特征的多尺度表达机制,利用多个尺度下的融合特征进行检测,使得算法能够对不同尺度下的目标进行有效检测;并对区域建议网络进行改进,根据目标检测区域的物理属性来定制Anchor,得到更加符合检测区域尺寸的区域建议;最后对其进行检测后处理,进一步优化检测结果。实验表明,该方法能够大大提高“问题地图”中不同尺度下不同大小尺寸目标的检测能力;特别的,该方法能够显著提高小尺寸目标的检测能力。其中,用于检测钓鱼岛的平均准确率值由0.4673提升到0.6710。