论文部分内容阅读
数据库中的知识发现(KDD)主要是研究如何自动地和智能地从海量的数据中提取出有用的知识和信息,它是目前相当活跃的一个研究领域。概念格模型作为一种用于数据分析的形式化的工具,已经在众多的领域中获得了广泛的应用。本文对基于量化相对约简格模型的数据挖掘方法做了研究,主要的工作包括: 1)概述了KDD的基本原理,描述了概念格模型及其扩展结构的基本概念、构造算法和实际中的应用情况,并将其与决策树方法做了理论上的比较。 2)提出了量化相对约简格模型,它以最简形式表示概念的内涵和外延,更清晰地反映了概念之间的依赖关系,有利于更有效地从大规模数据库中进行知识的发现。文中给出了渐进式构造量化相对约简格的算法,并对于数据更新时格结构的维护工作进行了研究,分别提出了插入对象和删除对象时的维护算法。 3)关联规则发现是KDD研究中的一个核心任务。本文以量化相对约简格模型为基础,分析了量化相对约简格和关联规则发现之间的关系,描述了基于量化相对约简格进行关联规则的快速发现的理论框架,讨论了通过对量化相对约简格结构分别进行动态剪枝和静态剪枝生成频繁概念子格的思想,并给出了相应的构造算法。另外,针对频繁概念子格结构的特点,进行了相关的关联规则提取的研究,并给出了规则发现和剪枝算法。