论文部分内容阅读
随着互联网的快速发展,无论是图像数量还是图像多样性均呈现爆炸式增长的态势。面对如此海量混杂的图像信息,如何有效地组织和管理图像数据成为当前的研究热点。图像分类作为计算机视觉领域的基础研究,是解决这一问题的关键途径。近几年,深度卷积神经网络在大规模图像分类任务中取得了突破性进展。利用足够大的多样性数据集进行模型的训练,基于深度卷积网络的研究成功地在图像分类任务中取得了前所未有的良好性能。在卷积神经网络中,卷积核起着核心作用。为了学习得到有效的卷积核,不少研究学者都致力于提出优化算法。目前的卷积网络模型普遍采用的是在大量带标签数据上运用随机梯度下降算法来学习卷积核,这种卷积核训练方式严格依赖于参数初始化和调优的经验。同时,这种卷积核学习方式极易陷入局部最优甚至无法使网络实现收敛。此外,传统的卷积神经网络是基于监督式学习的,这意味着在分类模型训练过程中,图像的标签是必须提供的。但是,虽然现如今的图像规模与日俱增,其中带有标签的图像却少之又少,这不免使得卷积神经网络不符合当前的实际应用环境。考虑到现有卷积网络模型的上述缺陷,本文提出构建一个简洁的无监督式网络模型用于图像分类任务,具体工作包括以下几个方面:1.利用经典的聚类算法K-means对预处理后的图像块进行聚类得到卷积核。这种卷积核学习方式非常简洁,摒弃了传统卷积网络众多参数初始化及调优的过程,有效地避免模型陷入局部最优。同时,这种无监督式训练方式,成功地解决了带标签图像样本稀少这个瓶颈;2.提出一种称为加权池化的下采样方式。加权池化充分考虑了池化域中每一个神经元的不同作用,通过赋予其一定的权值,控制每个神经元的影响力,有助于提高模型对图像平移等问题的不变性;3.在模型输出层提取最简单的直方图特征,并融入图像的空间信息特征,提高模型的几何不变性。另外,为消除图像特征的冗余,同时控制图像特征的维数,本文对相邻块直方图进行最大采样,将局部直方图特征转化为全局特征,增强对图像变形等问题的鲁棒性。