动态分配聚类中心的改进K均值聚类算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:Boogie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K均值算法(KMEANS)是一种应用广泛的经典聚类算法,但其有两个缺陷,即对初始聚类中心敏感及需要人工确定聚类的个数,因而聚类结果的准确率较低。针对K均值聚类算法现存的两个缺陷,为提高算法的精确性与稳定性,以及改善聚类性能,提出了一种改进的K均值算法。该算法通过定义的平均类间最大相似度指标值来确定最佳的K值,将所有数据点中密度较高的点作为备选聚类中心,将备选点中密度最大的两个点作为聚类中心进行初步聚类计算并更新当前聚类中心。当计算得到的平均类间最大相似度现值小于前次计算值,则依据相对距离原则从备选点中动态选择下一个聚类中心;否则,将当前的聚类中心作为最佳初始聚类中心进行K均值聚类计算。实验结果表明,改进后的算法不仅能够有效地提高聚类计算的精确性与稳定性,而且还能缩短聚类计算时间,具有一定的技术优势和应用前景。
其他文献
随着人口老龄化程度日趋加深,养老金融作为支撑养老产业发展的重要工具,发展空间巨大。然而,"养儿防老"的传统观念,以及依靠子代赡养的养老方式,成为我国养老金融发展的制约
设计并实现了一个大区域网络联机的实时共享物流信息管理系统。系统根据历史记录对物流信息进行分析,分析物流公司车辆的使用情况、给管理者系统的调配方案等,给出了实时共享
<正> 3.以音乐表演为目的而审美的较高层次要求 这个级别的审美主要是指“解码I”,但有时演奏者也会通过聆听别人的演奏而获得对作品的理解,所以和“解码II”也有关。(1)深刻
研究直接发酵法提取苜蓿叶蛋白的工艺,试验测定乳酸菌数,发酵时间和发酵温度等单因素的不同水平对苜蓿叶蛋白提取率的影响,并在单因素试验的基础上进行三因素四水平正交试验,
计数资料是由分类变量组成的,是研究不同类别或属性中频数的多少或频率大小所获得的资料。在临床科研中,收集的数据中往往包含了一些分类变量。由这些变量组成的计数资料必须
综述了近几年铑催化剂在环加成反应中的研究进展,主要包括[2+2],[2+2+1],[2+2+2],[3+2],[3+4]和[4+2]环加成反应等,讨论了铑催化下的环加成反应及其机理.
本文从金融市场风险传播的时间序列分析框架出发,沿着风险传播研究视角从宏观到微观转变的时间脉络,对微观层面上的风险传播与扩散模型、网络控制修复模型,以及它们的发展做
"生活教育"最初是由陶行知先生根据杜威的"教育即生活"改编而来的,其包含三个基本观点:生活即教育,社会即学校,教学做合一。本文通过对这个观点对幼儿园中的"生活"进行了简单
在微波辐射条件下,以α-猪去氧胆酸为隔离基,通过三光气桥连各种芳香胺,以很好的产率合成了一系列新的手性分子钳,其结构经^1H NMR,IR,MS和元素分析确证,并且考察了其对中性分子和D/