【摘 要】
:
该文对三种数据挖掘算法进行了研究,并对这些算法作了改进,其中包括:关联规则挖掘算法、事件序列中频繁情节挖掘算法、决策树挖掘算法.对于关联规则挖掘问题,针对当前挖掘算
论文部分内容阅读
该文对三种数据挖掘算法进行了研究,并对这些算法作了改进,其中包括:关联规则挖掘算法、事件序列中频繁情节挖掘算法、决策树挖掘算法.对于关联规则挖掘问题,针对当前挖掘算法需要对数据库进行多次扫描,以及在识别频繁项目集时采取模式匹配等问题,提出采用新的数据结构,使得通过简单的数据库操作就可识别频繁项目集,而且算法在计算时所需访问的数据库在不断减小,从而提高了挖掘的速度.在该算法的基础上,论文对多层交联规则挖掘问题进行了研究,并将改进算法的应用拓展到多层关联规则挖掘中,提出相应的挖掘算法.对于事件序列数据的挖掘问题.针对HeikkiMannila等的人算法没有考虑大数据集,且只可挖掘两类情节等问题,论文提出了一种改进的算法,该算法能挖掘所有可能的频繁情节,同时在算法中采用数据分割技术,使得算法适合挖掘大数据集.
其他文献
本文针对建筑行业提出了一种新型的配料仪的设计方法,配料仪的作用是将四种原料混合在一起,它是一种单片机应用于工业生产过程自动控制的典型产品。这些年来,随着建筑行业的发展
抄袭他人的研究成果,篡改或伪造数据后继续发表,给学术研究带来了极严重的危害。因此,建立一种快速准确的论文抄袭检测模型,是具有现实意义的。 由于汉语本身的特点,词语、句子
辽河油田特油公司是开采超稠油的生产单位,原油是以车辆拉运、手工操作的方式进行销售,即人工读表、手抄重量及手工统计的方式,原油丢失的现象时有发生,造成严重的经济损失。为堵
由于历史等原因,Internet/Intranet上的数据库系统不少是分布、异构的。某些情况下,这些数据库中的相关信息需要统一的进行管理,这就迫切需要开发出相应的应用系统来集成多数据库
随着制造业的迅速发展,“敏捷制造”及“全球制造”已成为发展趋势。在这种情况下,传统的面向单用户的CAD系统已不能满足设计要求,必须对原有的系统进行改进使之支持异地设计和
随着工作流系统应用的普及,越来越多的不安全因素被发现,因此工作流系统的安全机制就成为一个很重要的研究课题,而其中研究的重点就是安全工作流系统的授权和访问控制技术.传
随着Internet技术的不断发展,网络已经不再是一个单纯的信息平台,人们深刻意识到其作为一个庞大的计算平台的潜力。因此,以往的静态的、面向特定运行环境的软件系统已无法满足In
该文首先简要论述了分布式计算技术,之后集中在中间层的核心技术,即:中间件技术,详细分析研究了两类中间件:传统型中间件和平台型中间件.以此作为以后工作的基础.针对企业级
在软件工程任务中,使用控制流、数据流、控制依赖等程序分析技术分析和理解程序,并把得到的信息用于任务中.当前许多流行的程序设计语言提供了完善的异常处理机制,该文以Java
从1969年四个节点的ARPAnet发展到2002年拥有147,344,723台主机的Internet,计算机网络的高速发展推动了技术的创新和社会的进步。另一方面,网络也带来了信息安全等严重问题。近