一种在MapReduce下实现的KNN改进算法

来源 :重庆科技学院学报:自然科学版 | 被引量 : 0次 | 上传用户:xiaziaipao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类过程中,经典的最近邻分类算法(KNN)面对海量数据时的执行时间较长。对经典KNN算法进行改进,通过在训练阶段构造初级分类器以减少训练阶段的计算量,并在Hadoop平台MapReduce下予以实现。实验结果表明,改进后的算法可以在保证分类精度的情况下节省运行时间。
其他文献
伊拉克东南部A油田的主力产油层为Asmari组碳酸盐岩油藏,发育裂缝,油井产能差异大,水淹规律异常。利用该区相对丰富的偶极声波测井资料,对目的层开展了基于偶极横波各向异性
中小企业在国家经济体制改革与新工业发展创新道路上贡献出不可替代的作用和价值,中小企业要在经济发展新常态环境下保持持久的市场竞争力,有必要对内部控制制度进一步夯实提
该装置实现了对LED线阵显示以及80*80 mm黑白图文卡信息的快速录入。装置由旋转LED部分和主控部分组成,两个部分之间通过蓝牙通信。所有显示信息由主控部分人机交互录入或通
为实现液压型风力发电机在低风速下的恒转速控制,以大功率的低速大扭矩径向柱塞泵代替传统的定量泵,分析风力发电机在低风速下的性能。基于液压型风力发电机组的工作原理,建
随着改革开放的不断深入和全球化进程的加速,越来越多的企业走向集团化发展,对此企业也必须要对财务管理进行转型。有鉴于此,本文研究信息化时代下的财务管理转型过程中的特
在当今激烈的市场竞争下,企业之间竞争逐渐向个体所在供应链之间竞争转化,大数据、云计算等技术在社会各领域内的应用趋于广泛,海量数据得以呈现,大数据时代带来了新的发展机
随着全球对能源问题的关注与研究,未来电动汽车取代汽油车已成为必然,电动汽车也得到了越来越多的关注,各国从国家战略层面推出了电动汽车实施计划。但是当前电动汽车的实用
针对Clara算法在电力工程大数据分析领域的应用问题,文中介绍了Clara算法的基本思路与算法步骤,进一步提出了基于Clara算法的电力工程造价评估方法。其采用Clara算法通过反复
海上油田区域开发生产中存在资源配置不合理、产量递减率大、开发成本高等问题。运用节点分析法建立区域生产和成本优化数学模型,综合考虑各生产系统产油、产气、注水、外输
为了提高35 kV变电站造价预测能力,需要进行造价模型异常数据溢出控制,提出基于差异度特征分析的35 kV变电站造价模型异常数据溢出控制方法。构建35 kV变电站造价模型异常数