基于图的半监督维数约减方法的研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:lyt0821
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维数约减已经成为当前机器学习领域的受人关注的研究热点。维数约减是将数据由高维约减到低维的过程而用来揭示数据的本质低维结构。它作为克服“维数灾难”的途径在这些相关领域中扮演着重要的角色。在众多维数约减方法中,由于基于图的维数约减方法简单、容易理解和高性能等特点使其得到了广泛的学习和研究。基于图的方法把每个样本数据作为在图中的一个节点,强调样本数据结构的嵌入即高维空间中的结构在低维空间中得到保持。如何在高维样本上构造图是基于图的维数约减算法的关键。一个好的图再结合适当的降维算法就会有着良好的性能表现。其中,与传统降维算法不同,半监督降维在有限的有价值标记信息或者成对约束下经常可以得到好的低维嵌入比那些无监督降维方法。在过去的几十年里,有着大量的降维算法被提出如:传统的无监督降维方法主成分分析(PCA)、有监督降维方法线性判别分析(LDA)、流行学习算法、基于图的降维算法等等。但大多数方法都多少存在着一些问题,如小样本问题、分类问题、样本的非线性分布问题等等。在本文中针对在高维数据上构造的近邻图难以较好的刻画样本间的相似性,在其上的优化过程并不有助于后续的降维学习,同时也为了进一步提高维数约减算法的效率和降维后的分类精度,我们对半监督维数约减的方法进行了系统的研究。具体来说,论文主要工作包含如下2个方面:(1)提出了一种基于组合图的半监督维数约减算法——SSDRCG。SSDRCG利用随机子空间的思想,把每一个子空间通过聚类的方式构造子图。然后把各个子图融合在一起构成组合图。最后把我们构造的新图与基于成对约束的半监督维数约减算法相结合形成新的降维算法。为了验证该算法的性能,我们将SSDRCG分别与多种维数约减方法进行对比,通过在不同的人脸数据集上的实验证明,该算法降维后的分类精度高于其它方法,时间复杂度也低于增强型保举投影算法(ELPP)。(2)提出一种改进的基于混合图的半监督维数约减算法——SSDRHG。SSDRHG在混合图的构造策略上进一步改进,打造新的图,然后应用到基于成对约束的半监督维数约减中,既利用了同类约束和异类约束,同时也利用了未标记数据进行维数约减。同样的通过在2种不同的人脸数据集上进行实验,得到的结果与多种方法在相同参数下取得的结果进行对比,结果表明这种方法更加优越,不仅降维后的分类精确度高于其它相关方法,而且对近邻参数的选取和噪声数据更加的鲁棒。同时这样方法的思想也可以应用到其它基于图的学习中。
其他文献
随着计算机的广泛应用和网络技术的迅速发展,计算机数据在人们日常生活中越来越重要,其安全问题成为日益突出的问题。与此同时,数据安全技术也在快速发展,各种数据加密软件和网络
NP-难问题是计算机科学研究中的主要研究问题之一。Garey提出了若一个问题被定义为NP-难问题,则无法用计算机进行精确求解的论断。该论断为研究人员奠定了计算难解的界限,避
随着网络技术的不断发展,Web信息资源的极大丰富,如何高效地获取互联网上的资源以及对资源的有效分析处理,越来越成为数据挖掘工作亟待解决的问题。一些较为传统的方法仍然采
计算机和网络技术的迅猛发展大大提升了以广域资源共享和协作为主要目标的网格计算在计算机科学中的重要地位。网格计算中资源的大规模共享和协作的实现是建立在网格安全基础
对大多数机器学习和计算机视觉的任务来说,选择一个合适距离度量都是至关重要的。因此,以自动设定与选取合适的距离度量为目标的度量学习(DistanceMetricLearning,DML)方法引起
随着XML广泛应用,出现了大量的XML数据。为了更好的管理这些XML数据,人们设计了XML数据库。CoSQLRX系统是一个关系-XML双引擎数据库系统,可以同时处理关系-XML查询。本文着重
分类算法是当今机器学习领域中重要的研究方向之一,很多经典算法在实际问题中得到广泛的应用并取得了良好的效果。传统的分类算法假设数据分布均衡,并且以提高分类算法对数据
网络的自组织管理技术是无线传感器网络中研究的重要领域,其主要包括节点管理、资源与任务管理、数据管理、网络的节点部署、初始化与系统的维护管理等,它是保障无线传感器网络
随着信息技术的发展,环境的多样式和需求的多变性要求软件系统能够具有适应企业“面向任务”动态多变的能力,同时软件规模化生产和企业个性化需求之间的矛盾也日益增加,传统软件
随着军队信息化建设日益发展,军队内部各单位的网络系统也深入到各项事务中,网络规模越来越大,终端数量越来越多,使用和管理也日益复杂,特别是众多的非常正常工作应用软件、