【摘 要】
:
21世纪,人们已经进入到高速发展的信息时代。我们每天都面对海量的数据,这些蕴含大量信息的海量数据给机器学习、数据挖掘和计算机视觉等领域带来了严峻的挑战。聚类分析是数
论文部分内容阅读
21世纪,人们已经进入到高速发展的信息时代。我们每天都面对海量的数据,这些蕴含大量信息的海量数据给机器学习、数据挖掘和计算机视觉等领域带来了严峻的挑战。聚类分析是数据挖掘领域研究的基本问题之一,而非负矩阵分解是一种重要聚类分析算法。近年来,非负矩阵分解在图像处理、计算机视觉和模式识别等领域均受到了相当广泛的关注。非负矩阵分解能使数据维数获得一定程度的约减,能使数据的某种潜在结构变得清晰。非负的限制可以导致局部、稀疏的表达,这对外界噪声有更好的抑制作用。非负矩阵分解的一个重要变形是图正则化非负矩阵分解。该算法旨在让矩阵分解得到的低维因子能够尽可能准确的刻画和保持由邻接关系图反映的数据点间的流形结构。然而,实际数据往往存在质量问题,如误差、噪声、异常点等,图正则化非负矩阵分解难以全面准确的反映数据的真实特性,给聚类分析带来了困难。本文为了解决数据存在的质量问题,提出了一种新的非负矩阵分解算法:鲁棒图正则化非负矩阵分解(Robust Graph Regularized Nonnegative Matrix Factorization,RGNMF)算法,该算法通过1,2?范数替代2?范数,提高了图正则化非负矩阵分解的鲁棒性。我们给出乘积更新规则,并且提供了严格的收敛分析。我们在ORL和Yale人脸数据库上进行实验,证明了RGNMF算法的有效性。
其他文献
Bezier曲线是CAGD系统中最基本的造型工具之一。由于它采用一组独特的多项式基函数,使得它具有许多优良的性质。但是Bezier曲线段之间的拼接特别是二阶连续的拼接比较困难,而有
随着计算机的飞速发展和社会信息化程度的不断提高,信息是无处不在,信息的安全性问题也越来越受到人们的高度重视。在信息安全问题上,怎么产生形态优良的伪随机数至关重要,因为形
在实际中,许多系统的状态是部分可测或不完全可测,故构造观测器,并用估计状态实现反馈控制是一个非常有意义的研究工作.关于观测器的设计方法,目前已经有许多著作,然而,对于
手写文字识别技术已广泛应用于各类智能系统。粘接文字的分割是手写文字识别的第一步,因其分割难度之大,往往成为进一步识别甚至是整个智能系统的瓶颈,分割的好坏直接决定了识别
时间序列是根据动力系统观测得到的数据,作为研究系统内部规律的依据。目前时间序列分析已经在多个领域的应用中取得了极大的进展。本文尝试将奇异值分解方法应用于时间序列分
本文以某公司的销售提单数据为背景研究了统计方法在客户细分数据挖掘技术中的应用。首先简略介绍了数据挖掘和客户细分的相关内容,然后在客户细分的数据预处理和客户分类两
目前,在一些工业信号诊断上主要应用快速富立叶变换,这种方法在大多数应用中是有效的.但傅立叶变换在实际应用中有它明显的缺陷,它不是局部化的时频分析工具。小波分析提供了
许多大型科学计算问题都可以归结为求解偏微分方程或者方程组。一直以来,差分方法是求解偏微分方程的有力方法之一。随着并行计算机的出现和发展,并行算法的研究已经成为迅速崛
本文考虑下面五阶非线性中立时滞偏差分方程△2m(am,n△3n(xm,n,n+bm,n,xm-τ0,n-σ0))+△mf(m,n,xl1,m,σ1n,xl2,m,σ2,n,…,xlk,m,σk,n),+g(m,n,xρ1,m,δ1,n,xρ2,m,δ2,n,…,xρk,m,δk,n)=cm,n,(V)(m,n)∈
医药企业所面对的顾客是一个复杂的群体,面临的市场越来越广阔而复杂,任何企业无论规模如何,都不能满足整个医药市场的全部需求。因此,在对市场需求预测的基础上,将整个市场划分若