论文部分内容阅读
近年来,随着信息技术的发展,人们所面对和接触的数据量也逐渐增大。为了不被海量的数据所淹没,从中得到我们所需的知识,数据挖掘就应运而生了。它是一个新兴的边缘学科,汇集了人工智能、模式识别、数据库、机器学习以及管理信息系统等多学科的成果,其应用领域非常广泛,并且具有良好的应用前景。 本文对数据挖掘中的关联规则进行了详细的阐述,同时对目前在软计算领域的研究热点——粒计算进行分析研究。粒计算作为一种新的信息和知识处理的方法近年来已经被许多研究者所重视,并且在许多领域中得到应用。本文将粒计算方法与技术应用于数据挖掘中关联规则的挖掘领域,着重从另一个角度对关联规则的挖掘进行了更广泛的研究。本文在对经典的关联规则挖掘算法进行了详细的分析和研究并通过实例对它的特点以及局限性进行了归纳的基础上,提出了基于粒计算的关联规则挖掘模型,为基于粒计算的关联规则的提取算法的提出和构造做了理论上的准备。通过采用二进制串表示所定义的信息粒,提出了基于粒计算的关联规则挖掘算法。然后本文分别研究了在采用二维表的形式和链式结构来存储信息粒下,利用二进制粒位运算提取频繁项目集来发现关联规则。从而在经典的Apriori算法基础上实现了基于粒的关联规则的提取算法。 最后,文中通过一个实验,将经典Apriori算法和基于粒计算的关联规则的提取算法进行了对比,并对实验结果进行了分析。实验结果表明基于粒计算的关联规则挖掘方法是可行的也是有效的。