基于生成对抗网络的图像分类研究及其在脉冲星候选体识别中的应用

来源 :贵州师范大学 | 被引量 : 1次 | 上传用户:lost123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脉冲星是高度磁化的旋转中子星,具有体积小、密度大等特点。脉冲星的发现在物理和天文学领域都有着重大的意义。随着人工智能技术的发展,基于深度学习的图像识别方法被越来越多地用于脉冲星候选的识别。然而,脉冲星候选体数据集具有极端不平衡以及正类样本匮乏等特征,导致传统识别方法表现出模型偏移、效果不佳等现象;另外,这类方法需要大量的标签样本,这对脉冲星候选体数据集来说也是难以实现的。基于此,本文从生成对抗网络(GANs)的角度出发,探索非平衡数据集以及小规模数据集的图像识别与半监督学习问题。论文的主要工作与创新包含以下四个方面:(1)提出一种基于辅助分类器生成对抗网络(ACGAN)的图像识别模型CP-ACGAN。ACGAN是基于GANs提出的一种样本可控性生成模型,同时它也能预测样本的标签。但当把该模型用于图像分类时,却表现出收敛速度慢、识别效果差等现象。经分析认为这是由判别器的输出层网络结构以及模型损失函数导致的。因此,通过改进网络结构,重构损失函数以及引入样本生成与样本分类之间的权重因子,提出了一种新的图像识别模型CP-ACGAN。该模型能有效地利用生成样本补充训练样本的多样性,从而提高图像识别效果。同时,对权重因子的分析表明,CP-ACGAN模型是ACGAN、DCGAN以及CNN模型的统一表达形式。最后,通过在SVHN和CIFAR10上的分类实验表明:与传统识别方法相比,CP-ACGAN模型具有更好的图像识别效果;此外,对模型中的权重因子也进行了实验分析。(2)提出一种半监督学习模型SSL-ATJD。基于GANs的样本生成能力,提出一种半监督学习模型SSL-ATJD。该模型由一个生成器、一个分类器和三个判别器构成,同时模型中还包含了样本与标签之间的四类联合分布进行对抗训练。理论分析表明模型有唯一的最优解,且生成器生成的样本能有效补充标签样本的多样性。当模型达到平衡时,四类联合分布相等,相应的条件分布和边缘分布也相等。因此,模型不仅可以预测样本标签,同时还能可控地生成样本。最后,分别在MNIST、CIFAR10和SVHN上进行半监督实验,结果表明:SSL-ATJD模型具有当前最好的半监督分类与半监督生成效果。同时,在MNIST上的进一步实验还表明,该模型对半监督学习中标签样本的数量表现出极强的鲁棒性。(3)提出一种基于对抗训练的图像识别模型ICAT。进一步改进SSL-ATJD模型,得到一种基于对抗训练的图像识别模型ICAT。它由一个生成器、一个分类器和两个判别器构成。训练中,生成器与分类器相互监督、相互协作,最终共同达到最优。理论分析表明模型有唯一的最优解。当模型达到平衡时,分类器刚好是生成器的推理网络,即条件生成样本通过分类器后得到的预测标签与生成该样本的输入标签相同。因此,生成器生成的样本有效地增加了训练样本的多样性。ICAT模型不仅对小规模数据集和非平衡数据集具有出色的识别能力,而且可以生成类别可控的样本。最后,分别在MNIST和SVHN上进行小样本实验。结果表明ICAT模型不仅比CNN具有更好的分类效果,而且它的可控性也明显强于CGAN和ACGAN模型。(4)将模型应用于脉冲星候选体数据集FAST和HTRU。将提出的图像识别模型CP-ACGAN和ICAT分别应用到脉冲星候选体数据集FAST和HTRU上,以解决传统基于深度学习的识别方法面临的模型偏移和效果不佳等问题。实验结果表明:提出的模型不仅提高了识别效果,同时还降低了漏报率。相比之下,ICAT模型的识别效果更好,因此,也更适合用于脉冲星候选体识别。最后,还将SSL-ATJD模型应用到HTRU上,探索非平衡数据集上的半监督学习。结果表明,只需要对少量样本进行标记,该模型便可达到与全监督CNN模型相同的识别效果。因此,它不仅可以降低因样本标记带来的人力、物力等成本,同时对标签样本稀缺的数据集也有显著作用。
其他文献
陶行知先生说:"没有生活做中心的教育是死的教育,没有生活做中心的学校是死的学校,没有生活做中心的书本是死的书本。"应将幼儿的美术教育与生活相结合,文章从研究生活,幼儿园美
如何让绘画活动更加有趣,使简单的线条,多变的色彩,为孩子们插上想象的翅膀,而展现出一个丰富神奇的童心世界。本文从幼儿艺术教育的视角分析、探讨了发展幼儿绘画能力的方法
随着互联网行业和深度学习技术的快速发展,自然语言处理领域取得了前所未有的进展。自然语言推理在大数据的背景下取得了丰硕的成果,文本相似度分析是自然语言推理中一项基本