基于子空间学习与非凸稀疏回归的特征选择

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jojoy9912004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的进步促使各个领域都出现了海量高维数据。高维数据包含大量冗余特征与噪声,严重影响了学习任务的效率,降低了算法模型的准确率,因此如何采用降维方法来有效降低数据维数已成为研究热点。特征选择作为一种有效的维数约简方法,因保留了原始特征空间的语义信息而得到了广泛的研究与关注。现阶段特征选择方法已取得良好成效,但仍存在一些不足之处,比如流形结构信息保留不充分、流形结构保留策略对干扰不够鲁棒以及稀疏正则项效果欠佳等。针对这些不足,本文提出了一些特征选择算法来有效克服上述问题。本文研究内容如下:1)提出一种基于稀疏低冗余子空间学习的对偶图正则鲁棒特征选择算法(SLSDR)。首先,SLSDR以基于子空间学习的图正则特征选择框架为基础,并通过引入数据图拓展了这一框架。由于SLSDR同时在数据空间与特征空间构造图,因此可以同时保留数据流形与特征流形的几何结构来指导特征选择的进行。其次,SLSDR使用内积正则项来保证特征选择矩阵行的稀疏性,从而可以选出有代表性且低冗余性的特征。另外,算法使用l2,1-norm约束子空间学习残差矩阵来保证对outlier样本的鲁棒性。在12个基准数据集上的实验结果表明,SLSDR具有良好的性能。2)提出一种基于自适应结构学习与秩估计子空间学习的无监督特征选择算法(SLASR)。首先,SLASR将自适应流形学习策略引入子空间学习框架,因此不仅保留了局部结构信息,也保留了全局重构信息。得益于自适应流形学习策略的应用,相似度矩阵与低维嵌入的学习可以在同一个步骤中完成,从而相似度矩阵更加准确且对噪声更加鲁棒。其次,算法对拉普拉斯矩阵施加了秩正则项约束,这样就使得流形信息更准确。另外,SLASR采用l2,1/2-norm来约束投影矩阵,从而选择出稀疏与鲁棒的特征。实验结果也充分表明SLASR比传统的基于固定图的算法更有效。3)提出一种基于自适应对偶图与非凸约束的嵌入特征选择算法(DNEFS)。首先,借助稀疏回归框架,DNEFS同时保留了数据空间与特征空间的流形结构信息。通过引入信息熵原理,对偶图中的局部流形信息可以自适应地学习与更新,因此流形信息更加准确。其次,DNEFS采用新的非凸正则项来保证行的稀疏性。具体的,这一正则项由l2,1-norm与Frobenius范数的差分构成,并记为l2,1-2-norm。通过使用这一新正则项,DNEFS可以更好的处理冗余特征。在6个基准数据集上的实验结果表明,提出的DNEFS优于对比算法的性能。
其他文献
近年来,我国面临对内去杠杆、调结构、控风险,对外迎接贸易战以及地缘政治变化等错综复杂环境,美联储加息进程也给国内政策带来挑战。在这些因素的影响下,我国股票市场呈现跌
机器阅读理解是自然语言处理领域的基础研究方向。定一篇文章,该任务要求系统结合问题和选项的语义,自动给出问题的答案。随着深度学习技术的发展以及大规模阅读理解数据集的
计算机视觉几何领域有一类非常重要的问题是如何对受折射影响的场景进行三维重建。如今,受折射影响的视觉几何还有非常多的地方没有被探索,无论是受折射影响场景的稀疏重建,还是对场景的稠密化,均没有比较成熟的算法。经典的视觉几何的主要研究对象集中在单视点相机模型上,受折射影响的场景不适合应用单视点相机模型进行重建,所以有越来越多的研究去关注比单视点相机模型更广泛适用的非单视点相机模型。文章研究的是由已知的射
社会主义核心价值观是当代中国精神的集中体现,是凝聚社会共识的“最大公约数”。党的十八大以来,以习近平总书记为核心的党中央,以高远的历史站位、宽广的国际视野、深邃的战略眼光,将中国特色社会主义人才培养作为一项重大战略任务。这明确要求各级各类学校审慎思考“培养什么人、怎样培养人、为谁培养人”的根本问题。这项战略任务关乎到党的教育方针、学校的根本任务、教育教学改革等问题,由此,提出了“立德树人,培根铸魂
克氏原螯虾是我国重要的水产经济动物,目前面临的主要问题有:苗种繁育不足、养殖模式欠佳、单位面积产量低等。生物生理与行为的昼夜节律性是由其生物钟来调节的,它产生的内
随着研究生教育规模的不断扩大,研究生教育质量问题愈加得到社会各界的关注。2015年10月24日,国务院印发《统筹推进世界一流大学和一流学科建设总体方案》,要求按照“四个全面”战略布局和党中央、国务院决策部署,坚持以中国特色、世界一流为核心,以立德树人为根本,以支撑创新驱动发展战略、服务经济社会发展为导向,坚持“以一流为目标、以学科为基础、以绩效为杠杆、以改革为动力”的基本原则,加快建成一批世界一流
马克思分配正义理论是在批判和继承空想社会主义者和资产阶级古典政治经济学者的分配思想基础上形成的,是马克思主义理论的一个重要组成部分。马克思分配正义理论以分配从属于生产为逻辑起点,揭露了资本主义私有制的本质,批判了资本主义生产方式的非正义性,提出了按劳分配和按需分配原则,并指出实现人的自由而全面的发展是社会主义的最终目的。分配是关乎民生发展的基础性问题,关系到广大人民群众的切身利益和国家的稳定发展,
开发者在构建Web前端项目时不仅要考虑站点的内容和功能,还需要关注图形用户界面(graphical user interface,GUI)的设计与实现,而GUI是决定页面吸引力的重要因素。但GUI设计是一项需要良好的艺术品味和审美能力的工作,Web前端页面的开发人员往往不具备这样的能力,因此需要设计人员的介入,二者之间存在沟通和交流的巨大成本。但从另一方面看,互联网本身就是一个海量的作品集,包含大
板带材矫直机作为板带材轧制后的重要辅助设备之一,主要用于改善板带材的平直度,提高材料的力学性能,其矫直原理在于使材料连续反弯而发生弹塑性变形,使纤维层趋向等长进而被矫平。目前,矫直理论中关于压下量、弯曲曲率等工艺参数的计算与实际仍存在差距,其主要原因一方面在于大多矫直模型集中在假设及理想化矫直过程的研究中,定性分析偏多,定量分析偏少,另一方面是实际生产中存在的很多矫直问题一直没有得到关注,例如轧件
来泽证券公司江苏分公司所处的证券行业具有周期性强、不确定高的特点,受到国内外经济环境、资本市场表现和监管环境等多方面因素影响。代买业务、投资收入和投行收入一直是行业的主要收入来源,但代买业务随着持续竞争和佣金费率的下滑贡献度持续下滑,投资收入与市场表现密切相关、贡献度波动较大,投行业务深受政策影响。自2012年创新大会以来,证券行业迎来了飞速的创新和发展,资产规模与业务规模快速增加,融资融券和股票