关联规则挖掘算法的研究及优化

来源 :安徽大学 | 被引量 : 0次 | 上传用户:qq447105111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为适应信息处理的新需求,数据挖掘作为一种新的信息分析技术已经在当前的数据仓库环境中进入了实用阶段。数据挖掘,也称为数据库中的知识发现,是从大量的、有噪声的、不完全的、模糊的、随机的数据中,提取人们事先不知道的、隐含在其中的、但又是潜在有用的知识和信息的过程,其主要目的是从海量的数据中挖掘出对用户有价值的知识。关联规则的挖掘是数据挖掘领域中一个非常重要的研究方向。一般来说,关联规则的挖掘分为两步:(1)无遗漏的找出所有频繁项集:这些频繁项集的每一个出现的次数至少与预定义的最小支持度计数min_support一样;(2)由频繁项集生成强关联规则:这些规则必须满足最小置信度和最小支持度。关联规则的挖掘算法性能主要是由第1步决定的。本文在对经典的关联规则挖掘算法Apriori算法研究的基础上,对算法的优缺点进行了分析,针对Apriori算法的第一步连接步中生成的很多候选项集并不是频繁项集,为了这些项集花费了大量的系统开销之一缺点,本文提出了一种改进算法DDApriori算法,对Apriori中的剪枝步骤进行了改进,通过该方法,可以有效地减少大量无用项集和减少判断项集子集是否是频繁项集的次数。实验结果表明,优化后的算法有更好的效率。
其他文献
纹理图像分割作为图像处理和模式识别中一个重要的研究内容,一直以来是人们研究的热点。由于纹理图像不同于简单的图像,它具有大量复杂的纹理信息,因此,纹理图像的分割相对来
随着信息技术尤其是互联网技术的快速发展,电子商务应运而生并逐渐普及。电子商务系统数据库积累了海量数据,但对商家决策有价值的知识却非常匮乏。关联规则作为数据挖掘(Dat
图像作为移动增值业务中的一种主要元素用途越来越广泛,但是图像资源所占用的内存空间和移动设备对图像的处理速度却是一个很棘手的问题,所以如何降低内存空间占有量提高处理速
隐通道能够绕过安全策略的检查进行信息的非法传递,具有很强的隐蔽性,对信息安全造成了极大地威胁并增加了检测的难度。本文在分析典型隐通道检测技术和检测方法的基础上,针对源
本文讨论的软件安全检查工具支持C/C++和Java程序的安全漏洞检查。工具由前端和后端两部分组成,采用C/C++和Java独立的前端和共用的后端策略,以提高代码的可复用性和检查的精准
云计算作为一种新兴的商业计算模型,已取得长足的发展。软件即服务(SaaS云)是最常见的云服务交付模式之一,在云用户数量极具增长的同时,消费者的业务需求也从单一功能的服务
随着计算机应用的日益普及和深化,软件的安全性和可靠性也越来越受到人们地重视,软件测试则是保证软件质量的重要手段,所以从某种程度上来说,软件测试是软件推向市场前的第一
我国的互联网经过十年的高速发展,网民规模已达到3.38亿,普及率达到25.5%。网络已成为公众获取信息的主要渠道。在Internet上充斥着的大量信息流中,很大一部分是来自于人们的
随着计算机、互联网、图像处理技术的飞速发展,出现了越来越多的数字图像。怎样从这些巨大的数字图像资源中,快速有效地得到想要的图像数据越来越成为一个急需解决的问题。因
别名分析在提高数据流分析精度和构建性能良好的程序分析工具方面发挥着重要作用。本文在分析已有别名分析框架的基础上,提出并实现了一种路径敏感的跨过程别名分析方法。首先