基于FP-树的最大频繁模式挖掘算法研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:zhenming1215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从大型数据库中挖掘关联规则是数据挖掘领域中非常重要的研究课题。其中,最大频繁模式挖掘问题在关联规则挖掘任务中扮演着重要的角色,具有广泛的应用前景。 FP-树是算法FP-growth中提出的新的数据结构。借助于FP-树结构,算法FP-growth采用不同于Apriori系列算法的候选产生测试方法而采取模式增长方法挖掘频繁模式,取得了很好效果。 本文主要在以下几个方面对基于FP-树的最大频繁模式挖掘问题进行研究:第一是提出了基于FP-树的最大频繁模式挖掘算法FP-Max。在该算法中,我们首先介绍了FP-树的定义和构造过程,并分析了基于FP-树进行挖掘的可行性和完整性;然后我们提出基于FP-树的最大频繁模式挖掘算法FP-Max,试验表明算法FP-Max在挖掘密集型、频繁模式较长的大数据集时是有效的。第二是提出FP-树驻留磁盘的最大频繁模式挖掘算法FP-Max-Disk。算法FP-Max运行的前提是构造的FP-树能够驻留内存,但是当事务数据库TDB很大或者设置的最小支持度阀值min_sup很小时,那么构造驻留内存的FP-树将是不现实的。为此,我们首先将原事务数据库TDB划分为一系列投影数据库,然后将每个投影数据库构造为能够装入内存的条件FP-树,最后基于这些条件FP-树挖掘最大频繁模式。第三是研究探讨了基于FP一树的最大频繁模式并行挖掘问题。借助于多局部频繁模式树和并行投影技术,本文提出了两种基于共享内存计算模型的最大频繁模式并行挖掘算法。根据理论分析,这两种并行算法在采用了新的数据结构和简单的动态负载平衡技术后,可以实现各处理器独立异步运行、较小的1/O开销以及良好的负载平衡。
其他文献
无轴承异步电机是集电机和磁轴承功能于一体的新型电机。相对于磁轴承电机,无轴承异步电机具有空间利用率高、电磁效率高、结构简单等优点。因此,无轴承异步电机成为众多国内外专家学者研究的热点。但是,无轴承异步电机在高速、超高速运转的情况下,光电码盘等速度传感器不能满足长期高精度测速需要,如何获取转速信号成为制约无轴承异步电机走向实用化的关键难题。所以,无轴承异步电机的无速度传感器控制研究具有重要实用意义。
随着现代工业和科学技术的发展,无损检测技术已成为确保产品质量以及设备安全运行的重要手段,并且已经形成一门新兴的独立的综合性应用科学技术。无损检测是在不破坏被检材料或构件的情况下采用物理、化学等方法和手段,探测被检对象内部和表面的各种缺陷及某些物理性能。现代无损检测与评价技术,如超声波、X射线、磁粉、渗透和涡流技术对缺陷的定量测量,如缺陷的形状、大小、位置、取向、分布和内含物等以及对有缺陷的材料和产
生物识别技术的出现得益于现代电子集成制造技术的快速可靠算法的发展.作为生物识别技术中最为具有应用前景的指纹识别技术,近些年来更是取得了长足的发展并广泛应用在各种个
为了有效管理电力部门的日常工作,更好地保证调度安全运行,提高运行人员的业务素质,为运行生产服务,设计开发一套调度微机运行管理信息系统是十分必要的,也符合目前国内调度运行管理安全运行管理的发展趋势。 本文根据我国电力部门管理系统的最新进展,对调度运行管理的策略进行研究。从现场实际运行的角度出发,针对我国电力系统具体运行情况,自行设计开发了基于WINDOS平台的调度运行微机管理信息系统,该系统符
该文以智慧来源的假设为基础,对综合集成研讨厅中专家分析、决策知识的共享、重用和重建进行了探索,例如:以构造概念系统结构为目标,提出了基于动态概念空间的专家定性知识的
在工业生产中,通过改变过程工况或原料配比可以生产不同等级的产品,来满足不同的市场需求,为了达到一定的经济指标和产品质量要求,经常需要对操作变量做相应的调整,如何确定过程生产期望等级产品所需的过程操纵变量成为一公共问题,生产设计理论是解决这一问题的有效方法。尤其针对那些原材料成本高、生产周期长的产品的生产,如果能选择合适的生产设计方法确定过程所需的操作条件,就可以有效缩短生产周期,降低生产成本,进而
模型参考自适应控制可以处理缓慢变化的不确定对象的控制问题。内模控制可成功应用于含纯滞后的对象的控制,且鲁棒性强,结构简单,设计直观简便,在线调整参数少。模糊控制是近年来
随着科技的发展、社会的进步,在交通运输、航空调度、工程技术、生物生态学等领域出现了许多复杂的系统。这些系统往往既包含连续型动态又包含离散型动态,因而称之为混合动态系
本文首先介绍了船体制造系统的特性、功能,分析了在这一领域国内外的发展历史和研究成果,总结出了计算机辅助船体制造系统的功能,讨论了船体制造中数控技术应用。接着在此基础上
该论文是以内蒙古河套木业造纸厂打浆工段为主要研究对象.首先介绍了对打浆过程有影响的一些因素,介绍该DCS系统的基本特点.在此基础上分析影响打浆质量的工艺条件、衡量打浆