【摘 要】
:
聚类是将数据进行划分,并从中发现有用信息的一种有效手段,它在很多领域都有着非常重要的应用。K均值方法是聚类方法中较常用的一种,但对于大规模的数据,而且有计算资源和时
论文部分内容阅读
聚类是将数据进行划分,并从中发现有用信息的一种有效手段,它在很多领域都有着非常重要的应用。K均值方法是聚类方法中较常用的一种,但对于大规模的数据,而且有计算资源和时间约束的情况下,K均值方法已不能满足要求。该文提出的CFK-means方法是一种适合于大规模数据的、快速高效的递增聚类方法,它采用了聚类特性(Clus-teringFeatures,CF)结构来表示聚类,能更有效地保留和利用聚类信息。它只需扫描数据一次即可得到聚类划分,所需的计算时间和文件交换时间数倍少于K均值方法,而且聚类的准确度和K均值方法相当。通过对仿真数据和实际文本集数据进行的对比实验证明了CFK-means方法的有效性。
其他文献
可扩展置标语言XML(eXtensibleMarkupLanguage)是由W3C(WorldWideWebConsortium)组织于1998年2月制定的一种面向Internet应用的置标语言。作为对SGML(标准通用置标语言)的一
建立科学的绩效管理体系,是时代向人民法院提出的要求,探索创新出行之有效的法院绩效管理体系,是当前人民法院迫切需要解决的新课题。本文结合北京法院的绩效管理工作,分析设
<正>在实施振兴东北老工业基地战略的背景下,应辽宁省政 府邀请,世界银行外国投资咨询服务部(FIAS)组成一个专家 组,进行了“辽宁外国直接投资环境的诊断性研究”。这次研究
目的分析球性肺炎的多层螺旋CT的特征性影像学表现,探讨其误诊的原因。方法回顾性分析经病理(手术或穿刺)、临床观察证实、影像学误诊的17例球形肺炎CT表现。结果病灶大多位
目的探讨细菌性肝脓肿的CT及MRI影像学特征,提高对细菌性肝脓肿的诊断率和鉴别诊断水平。方法回顾性分析30例经穿刺细菌培养诊断或临床手术病理证实的细菌性肝脓肿的CT和MRI
介绍了Aspen Plus软件的物性数据库、单元操作模块和系统实现策略3个组成部分及其特点,以及该软件在烟气脱碳系统中的应用步骤,并通过实例模拟加以验证.当600MW机组烟气质量流量
转化医学作为现代医学研究的新方法,强调基础与临床之间的信息交流,对现代医学教育和人才培养提出了新的要求。病理生理学肩负着基础医学课程到临床医学课程之间的重要桥梁作
<正>河北丰航植保机械有限公司位于河北省石家庄晋州市,是一家经营无人直升机、农药无人机、巡线无人机、航空植保、飞控、农药喷洒、农用飞机的企业。凭借在无人机植保领域
基于霍尔三维结构的思想,结合矿山环境管理的相关理论和方法,从逻辑维、时间维和知识维三个方面来研究矿山环境管理问题。结果表明,从时间维出发,以时间为主线,结合逻辑维的