并行K-Means聚类方法及其在简历数据中的应用研究

被引量 : 0次 | 上传用户:sep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各领域技术的飞速发展,数据量也在急剧的增加。面对海量的数据,数据挖掘技术中传统K-Means聚类算法面临挑战,因此对如何提高传统K-Means聚类算法效率的研究,有助于更好的认识和利用数据信息。当前,网络招聘成为了各企业单位进行招聘的主要手段,但是每天大量的简历筛选使工作人员工作效率低下,人力物力耗费严重。将K-Means并行聚类算法应用在简历数据的处理过程中,有助于节省人力资源,同时能够帮助各用人单位更迅速的招聘到合适的人才。论文主要从以下三个方面开展工作:首先,为了提高传统K-Means聚类算法的效率,论文提出了一种并行K-Means聚类算法,该算法能在一定程度上减少通信量和计算量。论文在MPI消息传递编程环境下,采用Master/Slave编程模式对所提算法予以实现。论文基于算法复杂度和加速比等评价标准对所提算法进行评价,并通过实验与传统K-Means算法做了比较。实验结果表明,本文所提算法是正确有效的。其次,论文对简历数据的特点进行了分析,研究了简历数据的特征提取方法,使得简历数据能用较少维度的特征进行描述。为了验证所提特征的有效性,论文使用传统K-Means聚类算法对简历数据进行聚类。实验结果表明,本文所提取的特征能够有效反映简历信息,对简历数据进行聚类分析确实能够迅速挖掘到具有代表性的简历信息。最后,论文将本文所提的并行K-Means聚类算法应用到简历数据的处理过程中,并将聚类结果与传统K-Means聚类算法的实验结果进行比较。结果表明了并行K-Means聚类算法在简历数据处理过程中的正确性和有效性。综上所述,论文由实际问题出发,从理论分析和实际应用两个方面对传统K-Means聚类算法进行研究,提高了该算法的执行效率,并扩大了该算法的应用领域。
其他文献
柏辽兹是法国19世纪浪漫主义时期重要的作曲家、评论家和指挥家。他的一生坎坷曲折,没有固定职业,只能靠撰写音乐评论、创作音乐作品及举办音乐会来维持始终清贫的生活。而在
婚约彩礼是附有解除条件的赠与,随着男女双方当事人婚约的解除,彩礼也应返还。但我国《婚姻法》司法解释(二)关于彩礼返还的规定仍有待进一步完善,主要体现在如何明确诉讼时
边疆民族地区基层检察院队伍建设,是云南省检察机关队伍建设链条上的薄弱环节。经济社会发展滞后、职业保障机制不完善、培训管理模式不科学、工资福利待遇较低等因素导致边
增生性瘢痕属于病理性瘢痕,是皮肤创面愈合后瘢痕持续增生的一种病理现象。其组织学特点是以成纤维细胞增殖异常和胶原为主的细胞外基质过度沉积。增生性瘢痕发病率高,常常破
微积分中充满了辩证法.变量的出现,使辩证法进入了数学,于是产生了高等数学.微积分实现了直与曲、有限与无限的相互转化,体现了辩证法中的对立统一规律.
为满足经济的迅猛发展对能源的大量需求,电力作为能量的一种表现形式出现并受到各界认可,变压器作为现代科学技术水平下最主要的电力系统设备,其运行状态的好坏直接影响到发
1988年对于缅甸来说是特殊的一年,当年9月18日发生政变后,军政府上台,再加上1990年缅甸大选后军政府拒绝移交权力等原因,缅甸遭到了以美国为首西方国家的制裁,几乎成为国际政
禽流感(Avian Influenza)是由A型禽流感病毒(Avian influenza virus,AIV)引起的禽类传染病。疾病的严重程度取决于毒株的亚型、病毒的毒力、被感染禽的种类、日龄、性别、并
作为中国传统工艺的代表之一,漆艺有着其独特的艺术魅力及深厚的历史文化积淀。中国古代的漆工艺水平达到了很高的造诣,成为中国传统文化之精华的体现。据史料记载,中国是世
煤矿矿建工程作为煤矿生产准备阶段最为重要的一个环节,矿建工程施工质量于煤矿生产安全有着紧密联系,所以当前煤矿企业在发展中十分重视矿建工程施工,然而,由于矿建工程施工