一种基于FP-tree的最大频繁项目集挖掘算法

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户：jerryzhang1805

【摘要】

：

关联规则是由Agrawal等人首先提出的一个重要的KDD研究课题,它反映了大量数据中项目集之间有趣的关联或相关联系.发现频繁项目集是关联规则挖掘应用中的关键技术和步骤.近年

【作者】

：

朱玉全;孙志挥;宋余庆;陈耿;

【机构】

：

东南大学计算机科学与工程系,南京,210096

【出处】

：

第十九届全国数据库学术会议

【发表日期】

：

2002年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

关联规则是由Agrawal等人首先提出的一个重要的KDD研究课题,它反映了大量数据中项目集之间有趣的关联或相关联系.发现频繁项目集是关联规则挖掘应用中的关键技术和步骤.近年来,在频繁项目集的算法研究中先后出现了Apriori、AIS、SETM、PARTITION、ML_T2L1等数据挖掘算法,在众多算法中以Agrawal等人提出的Apriori算法最为著名,其后的数据频繁项目集,因而发现最大频繁项目集对数据挖掘具有重大意义。本文提出了一种快速的基于FP－tree的最大频繁项目集算法DMIA，并举例说明了算法的执行过程，算法DMIA只需扫描数据库D一次，从而大大提高了算法的执行效率。

其他文献

通过弱化朴素贝叶斯假设提高朴素贝叶斯文本分类器的性能

本文中，我们用CO特征定义来表述单词间的相互依存关系，并给出了基于 CO特征定义的文档表示法，特征筛选算法和朴素贝叶斯文本分类算法。从实验结果中可以明显地看出，使用CO特征定

会议

朴素贝叶斯假设文本分类器特征定义相互依赖关系文本分类算法依存关系筛选算法分类性能表示法文档实验单词程度

下一代互联网电视技术现状及发展趋势(二)

4.逐步实现相关功能致力于开发下一代互联网电视的日本生产商目前大多仍处于第一阶段。多家公司正在开发能够灵活处理视频流的执行环境,其中包括索尼公司的APPlicast、松下公

期刊

互联网Widget执行环境松下公司夏普公司技术现状索尼应用程序雅虎公司家电生产

基于数字图书馆应用的XML数据库性能评测研究

WWW上产生的海量XML数据已经成为现有关系数据库管理系统(RDBMS)的一个巨大挑战.由于传统的RDBMS主要为结构化的二维表数据而设计,因此它们很难胜任许多基于XML的、半结构化

会议

一个高效的多维关联规则挖掘算法

关联规则挖掘是数据挖掘的重要研究课题,近年来得到了广泛的重视和研究.一个关于关联规则的典型的例子是它在购物篮分析中的应用.本文采取“分而治之”的策略，提出了一种挖掘

会议

发展我国会展产业推动经济社会发展

文章介绍了会展业的定义及其发展历程,阐述会展业在促进经济发展、带动社会就业、提高城市知名度等方面的积极作用。 This article introduces the definition of MICE indu

期刊

展业会展产业城市知名度经济贸易经济发展会展世界博览会展会汉诺威世界园艺博览会

关联规则制导的遗传算法在文本分类中的应用

文本分类是处理和组织大量文本数据的关键技术,它一直是信息检索领域中的一个研究热点.文本分类旨在将大量文本划分为若干子类,使得各文本子类代表不同的概念主题.文本分类技

会议

一种新颖的基于最有效的跳跃显露模式的分类法

分类是一种重要的数据分析形式。目前，已经有许多种分类方法，但其中大部分都是内存驻留算法，通常假定数据量很小。随着数据库中数据量和维数越来越大，建立高效的、适用于大型数据

会议

跳跃显露模式分类法数据库数据挖掘

基于Markov链的电子商务网站频繁访问路径的发现

随着Internet的飞速发展,基于Web平台的各种应用受到了广泛的欢迎,基于Web平台的电子商务得到了空前的发展.对于一个电子商务网站来说,其拓扑结构蕴含了各个页面之间的关联关

会议

电子商务网站频繁访问路径拓扑结构日志文件用户访问相关页面行为建模网上广告数学基础平台合理布局关联关系应用信息商品浏览保存

基于面向属性规约方法的网页和超链的分类

网络上信息量的剧增,给网站的管理和用户的浏览带来一系列的难题.Web个性化技术,即Web站点根据用户的需求为其提供一对一的服务的技术,正是针对这些难题的解决应运而生的.目

会议

遗传进化神经网络数据挖掘技术

神经网络和遗传算法的结合是当前智能技术研究的重要内容，也是计算智能CI技术的重要组成部分。本文在分析BP算法和遗传算法机理之后，提出了一种遗传BP神经网络数据挖掘技术。由

会议

遗传算法进化神经网络数据挖掘技术应用效果遗传神经网络资源预测智能技术应用前景学习能力搜索能力计算智能鲁棒性组成石油模型机理

一种基于FP-tree的最大频繁项目集挖掘算法

与本文相关的学术论文