论文部分内容阅读
关联规则是数据依赖关系的有效描述方法,是数据挖掘研究的重要内容。传统的关联规则挖掘缺少挖掘的针对性,挖掘速度慢,挖掘结果难于理解,挖掘结果的数量巨大,需要进行大量的筛选以便抽取出有用规则。 另外,随着数据量的急剧膨胀,数据库结构也越来越复杂,数据表的维数越来越大。在这些因素中有的因素是对使用者预期的数据结构产生影响,而有的则与使用者的预期不相关。 本文介绍了关联规则挖掘的研究情况,分析了统计方法在数据挖掘中的作用,提出了一种基于统计和先验约束的关联规则研究方法。使用该方法不仅可以有效地减少那些对结果影响不大的变量因素的数量,而且还减少了本质上无意义的“非预期的结构”的规则的数量,提高了对大规模数据的挖掘效率,并在强规则中进行了关联分析。