【摘 要】
:
数据挖掘是当前KDD中的一个重要领域,而关联规则挖掘是数据挖掘应用最广泛的技术之一。现有的关联规则挖掘算法和模型主要是基于数据库或数据仓库的,采用集中式处理。随着分
论文部分内容阅读
数据挖掘是当前KDD中的一个重要领域,而关联规则挖掘是数据挖掘应用最广泛的技术之一。现有的关联规则挖掘算法和模型主要是基于数据库或数据仓库的,采用集中式处理。随着分布式数据库和网络技术的发展,大量分散的数据不可能集中起来处理,本文就这个问题对分布式关联规则的挖掘的算法进行了研究。本文首先分析和介绍了关联规则的基本概念和方法以及分布式关联规则挖掘方法和技术,讨论了关联规则挖掘的三种不同频繁项集的关系,基于完全频繁项集存在的问题,提出把挖掘最大频繁项集作为本文的切入点。为了更好的对分布式关联规则挖掘算法进行改进,对现有的典型算法做了实验,通过实验得出了改进的策略和解决方案。并提出一种基于被约束子树的分布式关联规则挖掘算法,该算法不同于以往的最大频繁项集挖掘算法需要不断更新最大频繁项集集合,而是利用高度压缩的FP_树顺序地挖掘出每个站点的最大频繁项集,只需扫描数据库两次,然后站点间采用加优先权值的方法来挖掘全局最大频繁项目集。由全局最大频繁项目集易得全局频繁项目集,再生成用户感兴趣的关联规则。最后,把本文改进的算法应用到分布式存储的高校教学科研数据挖掘中,得到教师教学科研工作的潜在规则,以辅助决策下一阶段的教学科研管理工作。
其他文献
在网络技术不断进步和快速发展的今天,网络环境也日趋复杂和急速恶化,网络安全面临越发严重的威胁和日益严峻的挑战,其直接、最终表现为攻防(攻击和防御)双方的不断循环、往
近几十年来,计算机和通信技术迅猛发展,人们在享受信息化带来便利的同时,也面临着重要信息在传播和使用过程中的安全性问题。随着混沌理论越来越得到人们的广泛关注,利用同步
多源图像融合是信息融合的一个重要分支。图像融合就是采用一定的算法,把两幅或多幅关于同一场景的具有互补特性的源图像融合成一幅新的图像,该图像含有比任何一幅源图像都多
决策树是分类应用中采用的最广泛的模型之一。与其它分类方法相比,决策树无需花费大量的时间和进行上千次的迭代来训练模型,适用于大规模的数据集,除了训练数据中的信息之外
低密度校验码(LDPC)是一种能逼近Shannon容量限的渐进好码,其长码性能甚至超过了Turbo码。由于低密度校验码具有译码复杂度低、错误平层低等诸多优点,它在信息可靠传输中的良
随着Internet和移动通信在全球的迅速发展和普及,移动计算模式的兴起,无线数据广播技术越来越成为一个重要的研究热点。无线数据广播是无线环境中的基本数据访问方式之一,可
管理信息系统(Management Information System,MIS)经过不断的发展,极大的方便了部署这些应用的企业提高工作效率和服务水平。但是,随着应用系统的增加,各个应用系统之间需要
基于构件的软件开发是解决软件危机的有效途径。在基于构件复用的软件开发过程中,构件库管理系统扮演了重要角色。在构件库管理系统中构件的表示及其检索是最基本也是最核心
在计算机科学领域,本体被定义为共享概念模型的形式化规范说明。应用本体的主要目的是为了知识共享和复用。因为本体的构造还没有一个统一的标准,所以在同一个领域内产生了大
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,应运而生了数据挖掘技术。通过数据挖掘我们可以找到对于商业销售及生产极为有效的一些信息,从而可以提高销售和生产