改进的稀疏子空间聚类算法研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:gogl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析旨在把数据对象划分为几个有意义的子集,也称类簇,以致于同一个类簇里的数据对象相似,不同类簇之间的数据对象不相似。而高维数据的聚类问题已经成为数据挖掘和机器学习里的一个挑战性问题。高维数据聚类方法主要存在两个困难:⑴.高维数据中出现的那些无关属性使聚类趋势不明显;⑵.高维数据的分类界限不明显。针对这些困难,本文在了解传统聚类方法的基础上,研究了高维数据聚类的主要方法:子空间聚类算法。其中,重点研究了稀疏子空间聚类算法。稀疏子空间聚类算法(Sparse Subspace Clustering)SSC在高维数据聚类方面比其他方法效果优异,并能够直接处理数据集里的噪声、缺失值和特异值,是高维数据聚类算法里的佼佼者。本文针对稀疏子空间聚类算法中权重矩阵构建方法,提出了新的见解,并对算法做出了改进。代替原有方法中只使用单一的稀疏系数,我们的方法利用数据对象的稀疏表示向量的相似度构建权重矩阵。此方法考虑到使用两个数据对象的解系数向量的全部信息来分析这两个对象的相似度,而不是传统的局部信息。另外,针对SSC算法采用的谱聚类算法,我们选用另一种计算较简便的谱聚类算法。形成了一个改进的稀疏子空间聚类算法(Modified Sparse Subspace Clustering)MSSC。最后,本文在聚类的一个应用领域——运动识别中,在真实的数据集上做了实验,并与原来的稀疏子空间算法及其他高维数据聚类算法进行了比较。实验证明了本文算法的有效性,并表明了我们的算法效果均优于传统聚类算法。
其他文献
聚合签名可以将n个不同的用户对n个不同的消息的签名合成一个签名,而验证者只需对合成的签名进行验证便可确信签名是否来自指定的n个用户,减小了签名验证的工作量和签名的存
如果想要综合利用同一个场景在不同成像器材、不同成像环境条件等不同因素的作用下所得到的多幅图像的信息,必须要先利用图像配准技术将这些图像进行配准对齐,让它们构成一个
随着微电子、计算机和传感器技术的高速发展,图像、声音等媒体信息的记录、存储、传输已进入数据化时代。图像、声音等媒体信息经过数据化处理之后形成的数据量非常庞大,这对
图像分割是由图像处理到图像分析的关键步骤,也是一种基本的计算机视觉技术。这是因为图像的分割、目标的分离、特征的提取和参数的测量将原始的图像转化为更抽象更紧凑的形
在目前信息爆炸的时代,迫切需要一些更加自动化、智能化的工具帮助人们在海量文本数据中迅速找到真正需要的信息。信息抽取技术应运而生,成为自然语言处理研究领域的重要方面。
实时任务调度的最大特点就是要满足任务的实时性需求。以往的实时操作系统任务调度理论研究,通常主要关注对实时性需求的满足,而对如何保证正确性研究不足。本文提出:正确性
交通事故是当前世界各国面临的严重问题,其中驾驶员疲劳是造成交通事故的主要原因之一。因此,开展驾驶员疲劳的研究工作,研制出一套有效的驾驶员疲劳监测系统,具有重大现实意
随着互联网的普及和发展,网络作为继传统媒体之后的第四媒体,其影响已经全面而深刻地渗入到了人们的政治、经济、文化生活等各个方面。网络传播具有自由性、交互性、开放性、虚
在组播安全问题中,组播密钥管理是关注热点,协同的密钥生成需要较大的计算量,为避免给密钥生成给节点带来的负载过大而影响网络性能,需要一个高效而计算量较低的密钥生成方案。尤
IP存储区域网(IP-SAN)是存储领域的一项重要技术,它同时具备IP网络的优势以及SAN架构的强大功能和扩展性。iSCSI协议是IP-SAN中实现存储设备访问的重要协议标准。以iSCSI协议