一种基于FP-tree的最大频繁项目集挖掘算法

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户:jerryzhang1805
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则是由Agrawal等人首先提出的一个重要的KDD研究课题,它反映了大量数据中项目集之间有趣的关联或相关联系.发现频繁项目集是关联规则挖掘应用中的关键技术和步骤.近年来,在频繁项目集的算法研究中先后出现了Apriori、AIS、SETM、PARTITION、ML_T2L1等数据挖掘算法,在众多算法中以Agrawal等人提出的Apriori算法最为著名,其后的数据频繁项目集,因而发现最大频繁项目集对数据挖掘具有重大意义。本文提出了一种快速的基于FP-tree的最大频繁项目集算法DMIA,并举例说明了算法的执行过程,算法DMIA只需扫描数据库D一次,从而大大提高了算法的执行效率。
其他文献
本文中,我们用CO特征定义来表述单词间的相互依存关系,并给出了基于 CO特征定义的文档表示法,特征筛选算法和朴素贝叶斯文本分类算法。从实验结果中可以明显地看出,使用CO特征定
4.逐步实现相关功能致力于开发下一代互联网电视的日本生产商目前大多仍处于第一阶段。多家公司正在开发能够灵活处理视频流的执行环境,其中包括索尼公司的APPlicast、松下公
WWW上产生的海量XML数据已经成为现有关系数据库管理系统(RDBMS)的一个巨大挑战.由于传统的RDBMS主要为结构化的二维表数据而设计,因此它们很难胜任许多基于XML的、半结构化
会议
关联规则挖掘是数据挖掘的重要研究课题,近年来得到了广泛的重视和研究.一个关于关联规则的典型的例子是它在购物篮分析中的应用.本文采取“分而治之”的策略,提出了一种挖掘
会议
文章介绍了会展业的定义及其发展历程,阐述会展业在促进经济发展、带动社会就业、提高城市知名度等方面的积极作用。 This article introduces the definition of MICE indu
文本分类是处理和组织大量文本数据的关键技术,它一直是信息检索领域中的一个研究热点.文本分类旨在将大量文本划分为若干子类,使得各文本子类代表不同的概念主题.文本分类技
会议
分类是一种重要的数据分析形式。目前,已经有许多种分类方法,但其中大部分都是内存驻留算法,通常假定数据量很小。随着数据库中数据量和维数越来越大,建立高效的、适用于大型数据
随着Internet的飞速发展,基于Web平台的各种应用受到了广泛的欢迎,基于Web平台的电子商务得到了空前的发展.对于一个电子商务网站来说,其拓扑结构蕴含了各个页面之间的关联关
网络上信息量的剧增,给网站的管理和用户的浏览带来一系列的难题.Web个性化技术,即Web站点根据用户的需求为其提供一对一的服务的技术,正是针对这些难题的解决应运而生的.目
会议
神经网络和遗传算法的结合是当前智能技术研究的重要内容,也是计算智能CI技术的重要组成部分。本文在分析BP算法和遗传算法机理之后,提出了一种遗传BP神经网络数据挖掘技术。由