论文部分内容阅读
PCA和LDA是模式识别和机器学习领域两种经典的特征提取算法。但是将上述两种方式应用到图像数据时,需要将以图像矩阵表示的图像数据转化成对应的图像向量形式,从而会产生数据结构信息丢失,数据维度过高,计算复杂度过大,分析困难等问题,为了解决上述问题,有学者提出2DPCA和2DLDA,然而2DPCA和2DLDA是基于原始的PCA和LDA提出的,都是以欧氏距离的平方来度量图像样本间的相似度,使得将上述算法应用在含有噪声和遮挡的图像数据时,鲁棒性变差。针对上述问题,本论文从样本的相似度度量方式入手,实现了基于L21范数的2DPCA和基于L21范数的2DLDA。论文的主要内容包括:针对2DPCA对噪声和异常点敏感的缺点,提出基于L21范数的二维主成分分析,即L21-2DPCA,该算法使用L21范数来替代欧氏距离的平方来度量数据样本间的相似度,构建一个基于L21范数的最大化样本间协方差的优化模型。本论文中将该问题转化成矩阵迹的优化问题,利用矩阵的奇异值分解,采取一种非贪婪的迭代算法得到该问题的局部最优解,并且使用具有旋转不变性的L21范数来构建协方差矩阵,能够保持数据的几何结构。在Extended Yale B,PIE,LFWcrop以及AR人脸数据库上的实验结果表明,本文所提的算法能够获得更加鲁棒的特征,算法运行时间短,实验结果更优,并且具有局部收敛性。针对2DLDA对含噪图像性能退化明显的缺陷,提出基于L21范数的二维线性判别分析,即L21-2DLDA,该算法使用L21范数来衡量样本类内和类间的散布距离,构建一个基于L21范数的鲁棒判别特征提取模型。L21-2DLDA使用具有旋转不变性的L21范数作为散布距离度量方式,能够很好地保留判别几何结构,并研究了一种非贪婪的迭代算法来最大化L21-2DLDA的目标函数值,将该优化问题化简成迹比值的形式,通过构造一个易于求导的辅助函数,并结合投影次梯度方法,整体优化投影矩阵,从而使得原始目标的函数值更优。在Extended Yale B,PIE以及AR人脸数据库上的实验结果表明,本文所提的算法能够提取到更加鲁棒的判别特征,实验结果更好,并且具有较好的收敛性。