论文部分内容阅读
模式鉴别分析是模式识别的重要研究方向,如何提取具有鉴别力的特征是模式分类的关键。近年来,流形学习成为机器学习和模式识别领域的热点,其主要目标是寻找嵌入在高维空间中的低维流形。本文针对模式分类中的高维数、小样本、非线性、非结构化等问题,深入探讨了基于流形的降维与鉴别分析的理论和方法,并将流形学习从单流形向多流形拓展。论文的主要工作和贡献体现在以下几个方面:1.提出并实现了半监督边界鉴别分析(Semi-supervised MarginalDiscriminant Analysis, SMDA)。该方法基于样本的局部信息,在保持相邻同类样本内部邻域结构的同时,最大化相邻不同类样本之间的距离。SMDA采用半监督学习,充分利用标记和未标记样本,提高识别准确率。通过矩阵分解得到最优投影向量,降低了计算复杂度。在人脸数据库上的实验结果证明了算法的有效性。2.在半监督边界鉴别分析的基础上,将其推广到核空间,提出了核半监督边界鉴别分析(Kernel Semi-supervised Marginal DiscriminantAnalysis, KSMDA)。该方法将样本投影到高维特征空间,提取非线性特征用于识别。引入相关性度量,提出了相关半监督边界鉴别分析(Correlation-based Semi-supervised Marginal DiscriminantAnalysis, CSMDA),在实际分类问题中,显示出优于欧氏距离的性能。3.提出了基于动态图嵌入的鉴别分析(Dynamic Graph Embedding,DGE)和基于Grassmann流形的半监督图像集鉴别分析。DGE方法通过拉近相同序列中图像的距离,同时最大化不同序列中图像的距离,在鉴别分析中引入动态信息,获得了比基于静态图像更好的性能。半监督图像集鉴别分析通过将图像集建模为Grassmann流形上的点,引入核函数和未标记样本,基于数据局部邻域结构求取投影矩阵,将图像集的识别转化为一般的鉴别分析问题。4.提出了多流形假设,即不同类别的数据位于不同的流形上(各流形维数可以不同),呈多流形分布。探讨了多流形分类算法,并分析了其中的几个关键问题,给出了多流形假设下的数据分类框架。该方法分别学习属于每一类的流形,通过随机优化算法得到每个流形分类意义下的最优维数,并设计了基于最小重构误差的分类器。5.流形学习已被广泛地应用于人脸表情识别,将不同的人脸表情建模成一个嵌入在高维空间中的低维流形。本文提出了基于多流形的人脸表情建模和识别框架,认为不同的表情分布于不同的流形上,同时可能具有不同的维数。详细探讨了表情特征提取、表情学习和表情分类算法。并通过在不同表情数据库上的实验,验证了算法的有效性。