【摘 要】
:
聚类分析是目前机器视觉和数据挖掘领域的热门研究内容之一,近年来大数据分析和挖掘研究热潮的兴起,使得对数据聚类的探索研究受到了极大的关注。聚类分析的目的是将数据集中
论文部分内容阅读
聚类分析是目前机器视觉和数据挖掘领域的热门研究内容之一,近年来大数据分析和挖掘研究热潮的兴起,使得对数据聚类的探索研究受到了极大的关注。聚类分析的目的是将数据集中的样本划分为若干个类别,使得同一类中的样本之间尽可能相似,而不同类之间的数据尽可能存在较大的差异。子空间聚类算法是目前聚类分析研究的热点方向之一,该类方法假设数据分布在不同的低维子空间中,通过构建数据的子空间实现数据的分类。稀疏子空间聚类算法(Sparse Subspace Clustering,SSC)是子空间聚类的代表性方法,其基本思想是利用数据线性自表示得到具有稀疏结构的自表示系数矩阵,利用系数矩阵构建数据的相似度度量矩阵,并通过谱聚类算法实现聚类。稀疏子空间聚类算法已经成功运用到人脸、手写字、纹理等数据上的聚类应用中。尽管稀疏子空间聚类方法在许多聚类应用上表现出较好的性能,然而这些方法主要面向的是单视数据的聚类。在现实世界中,许多信号可以通过不同的视角进行观测,并且同一数据也可以用不同的特征进行描述,通常这类数据被称为多视数据(Multi-view Data)。多视数据既包含不同视数据的共性信息,也包含不同视数据的差异互补信息,因此更有利于数据的聚类分析。现有的多视聚类方法对多视数据的共性信息和差异性信息的利用都分别进行了探讨,但还没有考虑共性信息和差异性信息的融合利用问题。针对多视数据的聚类问题,本文提出了一种差异性与一致性联合约束的多视子空间聚类算法,该算法在子空间聚类中同时考虑数据的共性和差异性信息,并且探讨了模型参数的自适应调节机制。本文的主要贡献归纳如下:(1)为了解决多视数据的聚类问题,提出了一种差异性与一致性联合约束的多视子空间聚类算法,将多视数据的一致性约束和差异性约束统一到同一个优化框架中;(2)研究了算法模型中一致性和差异性约束参数的调节机制,提出了一种基于数据属性的自适应多视子空间聚类算法和基于动态权值迭代的自适应多视子空间聚类算法。本文在多个数据集中进行实验测试,数据集分别为多特征数据集和多视角数据集,与相关的聚类方法相比较,本文提出方法对多视数据的聚类有明显的提升效果。
其他文献
随着互联网的飞速发展,网络中产生了大量短文本,这些短文本涉及的内容与领域多元化,逐渐成为使用频繁且公认的沟通方式。电子商务评论、信息检索、智能问答系统均是海量短文
全国经济综合竞争力研究中心在京发布的《“十二五”中期中国省域经济综合竞争力发展报告》蓝皮书显示,福建省域经济综合竞争力排名全国第九,其中,可持续发展竞争力排名全国
柱状腔向列相液晶系统是将向列相液晶注于圆柱腔内所构成的液晶系统。由于液晶分子的取向及有序度易受到边界限定性效应、外场、温度等因素的影响,使得柱状液晶系统有着丰富
近些年随着互联网与信息技术的快速发展,互联网的规模得到了巨大的提升,它向用户提供的信息也正在急剧增加,我们正在面对一个“大数据”的时代。在这海量的数据中,如何获取最
20世纪90年代开始在国际上掀起了消费新潮流——绿色消费。绿色消费深刻的反思了现代工业社会的非生态的消费模式。传统的非生态的消费模式极大的破坏了环境和浪费了资源,是
随着人们对视觉消费的需求提升,图像超分辨率重建技术成为近年来计算机视觉领域中的研究热点。超分辨率是一种通过软件算法将低分辨率图像转换为高分辨率图像的技术,超分以后的高分辨率图像相比较低分辨率图像,图像细节信息更加丰富,纹理更加清晰。超分辨率已经广泛应用于日常生活的多个行业:视频监控,医疗图像,遥感成像,电子消费等领域。图像超分辨率重建领域的优秀算法众多,大致可分为三类:基于插值的方法、基于重建的方
随着我国特高压直流输电工程的建设,电网一体化特征不断加强,电网送受端之间的耦合日趋紧密,故障对电网运行的影响由局部转为全局,特高压直流输电工程一旦发生故障,会严重影响送受端电网的稳定性。目前针对直流故障后送受端电网的调度控制问题,仍是以传统的仿真模拟分析为主。本文采用数据驱动方法,基于无监督学习算法对特高压直流故障后的送受端电网特征及控制策略进行深入研究。主要研究工作及成果如下:1)提出了基于改进
我国对于过度劳动的研究起步较晚,而且多集中于社会保障和人力资源领域,法学领域对于过度劳动的概念、成因、救济方式等问题的探讨是不够充分的。处于社会主义经济发展的初级阶段,伴随经济高速发展的同时,各种因素也制约着我国劳动者休息权的实现,普遍存在过度劳动的现象。造成这种现象的原因有:一方面,我国的劳动基准制度不够完善,工时制度、休息休假制度、劳动定额制度不够完备;另一方面,现行法律无法对企业的过度用工现
Spark Streaming是大数据批量流式计算系统的最新进展,其核心技术特征是将接收的流式数据按时间顺序切分为多个小批次,并使用批处理计算技术周期性地进行数据处理,以获取近实
自多媒体产生以来,由于其内容丰富、信息量大以及方便快捷的特点受到了对感官交互要求较强的教育、商业等行业的所青睐。传统的多媒体的控制是在PC端实现的,但随着无线传输网