快速挖掘最大频繁项目集算法及可视化实现

来源 :兰州大学 | 被引量 : 0次 | 上传用户:2034912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在关联规则、强规则和片断等数据挖掘问题中,有效挖掘最大频繁项目集的算法十分实用,最大频繁项目集唯一表示了所有的频繁项目集,通常情况下只需发现最大频繁项目集,因为有了它,所有的频繁项目集就可以被产生出来.在该论文中,编写了一个挖掘最大频繁项目集的软件,包括两个部分:一部分是新颖的FDMFIA(快速挖掘最大频繁项集算法),该算法基于频繁模式树(FP-tree)进行挖掘工作.FDMFIA不仅能够减少读取数据库的次数,而且还能减少候选项目集的数目.实验表明该算法的效率是非常高的,尤其在最大频繁项目集比较长的时候.另一部分是可视化,它能有效显示最大频繁项目集,并由三组可视化构成:原始数据可视化,FP-tree可视化,最大频繁项目集可视化.它们在数据挖掘可视化方面走出了第一步,每一部分均为OpenGL实现.最后,介绍了一些业已做好的工作,一些做的不好的工作,以及对将来工作的一些想法.
其他文献
该文首先介绍了粗糙集产生的背景以及粗糙集的一些基本概念,并将粗糙集与其他几种处理不确定性理论作了比较,同时对粗糙集的发展、知识发现以及粗糙应用于知识发现的优点作了
关联规则是由R.Agrawal等人于1993年提出,关联规则挖掘是数据挖掘的一个重要的分支,其经典算法是Apriori算法,用于挖掘布尔型频繁项集,但是该算法存在在对大型数据库的挖掘时
本文分析了现有应用集成方案存在的不足以及当前Web技术发展的新趋势,研究了当前的Web Services技术原理和特点,探讨了Web Services技术在应用集成方面的优势,提出了一种基于Web
本论文以现代铁路组织原理为基本设计思想,综合当前最新的信息管理技术和网络结构体系系统,致力为铁路客运生产信息的管理,设计和实现一套包括硬件和软件基础平台,方便、实用、高
随着Internet的迅猛发展,网上信息资源原来越丰富,网络已经成为人们获得信息的必要途径和重要手段,但网络信息具有海量、分布、动态变化和结构复杂等特点,使得用户无法有效利
本文着手进行跨平台网络考试系统的开发,在校园网上实现分专业的试题库管理和网络考试,实现学校考试的规范化、科学化、系统化。  本文介绍了系统的开发背景、目的、意义,介绍
本课题来源于导师所承担的科研项目——国家科技重大专项航空发动机微孔冷加工超快激光数控机床(2014ZX04001041),主要研究PCI-E总线在数控系统中的应用。和传统的PCI、PCI-X
随着计算机软硬件系统日益复杂,如何保证其正确性和可靠性成为日益紧迫的问题。各国研究人员为解决这个问题付出了巨大的努力,并取得了很大的进展。在提出的诸多理论和方法中
该文首先给出了弱点及弱点分类的定义,并分析了国际上典型的弱点分类方法的研究成果.攻击者利用系统弱点的目的就是为了提升自己对系统的访问权限,为此该文引入了一种新的弱
文本形式的知识是人们每天接触最多的知识形式.在现实生活中,人们非常希望能够快速地了解文章的主要内容,从而快速找到自己感兴趣的话题.为了更好地满足人们的需求,文本挖掘