论文部分内容阅读
在计算机视觉的研究领域中,传统图像分类的目标通常是隶属于不同基础类别的物体,而实际应用场景对图像的分类粒度提出了更加细致的要求,因此细粒度图像分类成为当今研究的热点之一。细粒度图像分类任务的研究目标往往是属于同一基础类别的不同子类对象,其分类难点在于不同类别间仅有细微的局部差异,而同一类别内却可能出现特征差异大的现象,同时复杂的背景特征也给图像识别带来了干扰因素。基于细粒度图像分类的研究前景和任务难度,本文从卷积神经网络训练过程中损失函数的改进和细粒度图像特征提取的细化两方面,分别针对不同细粒度图像数据集构建和分析识别模型。本文的主要工作如下:(1)基于分类树损失函数的细粒度植物图像分类方法。交叉熵损失是神经网络多分类任务中使用最广的损失函数,本文在交叉熵损失函数的基础上,依靠卷积神经网络出色的特征提取能力,借鉴植物分类学中多级分类单位构成的分类树结构,提出了针对细粒度图像多级分类的分类树损失函数。在自然背景植物图像数据集Plant CLEF上的实验结果表明,该分类树损失函数能够有效指导卷积神经网络的训练过程,且易于实现,具有良好的迁移性,较现有的识别算法具有更优的识别精度。(2)基于多尺度特征融合的细粒度岩石图像分类方法。为了在卷积神经网络的学习过程中统筹图像的整体特征和细节特征信息,本文综合目标检测算法定位、多尺度特征采样和超图特征融合的方法,提出了基于多尺度特征融合的岩石分类方法。在自建岩石图像数据集Rock-314上的实验结果表明,该识别方法细化了岩石图像的特征提取过程,在兼顾样本全局宏观特征的同时,充分挖掘岩石图像多种尺度的细节信息,捕捉图像中的细粒度特征,有效提高了细粒度岩石图像的识别准确率。