基于维数约简与核学习的高维数据分类方法研究

来源 :中国矿业大学 | 被引量 : 1次 | 上传用户:songking99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的飞速发展,互联网中的图像、音视频、文本以及生物信息数据往往呈现高维特征,这种高维度输入数据往往会导致现有机器学习模型性能大幅下降或不适定问题的出现,因此,如何从高维数据中有效提取特征,以提升高维数据环境下具体学习任务的性能,成为模式识别、机器学习、数据挖掘、计算机视觉等领域的研究热点。面对高维数据分类问题中存在的高维数、非线性、小样本等挑战,利用机器学习、模式识别和计算机等多学科交叉的理论和方法,以维数约简、多核学习、非参核学习、稀疏表示等方法为基础,针对现阶段高维数据维数约简算法和核学习算法存在的不足,研究基于核学习和稀疏表示的高维数据识别方法,并将所提方法成功应用于人脸识别、文本分类等实际问题。所取得的主要研究成果包括:(1)针对现有多核维数约简方法学习效率不高的问题,通过在传统多核维数约简模型中引入谱回归方法并进行式推导,提出了基于谱回归和迹比率最大化的多核维数约简方法,基于设计的多核维数约简模型,提出了更加高效的多核维数约简算法,有效解决了多核维数约简模型中稠密矩阵的广义特征值分解问题。在高维数据集上的实验结果表明,该方法兼具谱回归和多核学习的优势,获得了比现有多核维数约简方法更好的学习性能。(2)针对现有有监督多核维数约简假设每类数据均服从高斯分布的强限制条件,为解决面向高维数据的实际应用中该条件不成立问题,提出一种基于谱回归的边缘Fisher分析模型,并对基于单核的边缘Fisher分析模型进行多核拓展,分别提出了基于边缘Fisher分析的线性、单核和多核维数约简算法。训练算法同时具备谱回归和MFA的优点,能够充分利用数据集的流形结构和类别信息,解决了原始数据非高斯分布条件下的高效维数约简问题。(3)针对半监督非参核学习算法处理高维和稀疏数据可能导致的流形假设失效问题,通过把数据低维嵌入模型引入半监督非参核模型,提出基于低维嵌入的半监督非参核学习模型,并证明了该模型可以转换为迹比率优化问题,从而克服了传统非参核学习方法对流形假设的依赖,基于所提出的框架,推导出了一系列半监督嵌入式低秩核学习算法。在标准数据集上的实验结果表明,提出方法的性能明显优于现有同类方法。(4)针对传统核稀疏表示分类方法在高维数据集上分类精度较低且计算复杂度较高的问题,提出基于谱回归和组合范数的核稀疏表示分类方法。该方法先采用谱回归分析得到样本数据的低维表示,再通过核方法将其投影到高维特征空间使其更加具有可分性,通过目标函数组合范数约束,有效利用了数据集的流形结构和稀疏特性,较好地解决了高维人脸图像核稀疏表示分类问题。在标准人脸图像数据集上的实验结果表明,该方法不仅提高了识别率,而且降低了算法时间,可以有效应用于高维人脸图像数据的分类问题。
其他文献
目的探讨以内苁蓉、刺五加、大枣为主要原料制成的软胶囊抗疲劳和抗辐射作用。方法设立3个实验组,每天分别以0.18、0.36和1.08g/kg.bw剂量的软胶囊给小鼠灌胃一次,同时设立空白对照
为了实现党在新形势下的强军目标,加速推进院校教学工作向实战聚焦、向部队靠拢,"通信原理"课程建设以"着眼实战化教学转型,强调理论与装备融合,突出信息指挥能力"为理念,具
以玉米为实验材料,研究不同浓度的油菜素内酯(BR)、拉肖皂苷元(LA)及拉肖皂苷C(IG-C)对玉米种子萌发及幼苗生长的影响。结果表明,不同处理浓度对玉米种子萌发及幼苗生长有显著差异,浓
随着移动机器人的广泛应用,其种类与应用环境在不断增加,正逐步从室内环境向室外环境扩展。对于在室外工作的自主移动机器人,包括无人驾驶汽车,能够具有良好的环境感知和场景
党中央关于大学生思想政治教育的目标对加强和改进独立学院学生思想政治教育提出了紧迫要求。独立学院学生党建和思想政治理论课教学作为思想政治教育的两种方式,有机地结合
水下图像在水下探测中具有重要意义,通过对直观图像的研究可以获得各种未知环境的信息。由于水下信道环境复杂,以及水下图像成像设备的特性导致了成像结果对比度低、图像质量
基于第十三次中国私营企业调查数据,报告回溯2008—2018年中国私营企业履行企业社会责任状况,对其发展趋势进行了描述性统计和分析。报告发现,过去10年,私营企业在员工权益、
设计了风洞内支架式三自由度频率可调的弹簧悬挂装置,针对D形覆冰六分裂导线节段气弹模型分别在3种典型风攻角下进行了5种竖/扭自振频率比的变风速舞动试验,通过单目测试技术