论文部分内容阅读
随着云计算、物联网等技术的兴起,流数据作为一种新型的大数据形态广泛存在于各个邻域。该文提出面向大数据的基于分布式计算平台Storm的流分类挖掘算法及系统,采用并行化窗口和CVFDT算法,利用分布式平台来检测数据流中是否发生概念漂移,从而自适应的改变建模样本数据的流入,提高流数据模型的准确率和效率。