论文部分内容阅读
随着信息技术的日益发展以及共享概念的普及,世界上的数据量正以惊人的速度迅速膨胀,不同领域的人们都迫不及待地想从这些数据中提取自己想要的信息。为了能正确的提取想要的信息,数据清洗的过程必不可少。
数据的逻辑一致性检测正是数据清洗过程中的其中一个步骤。然而,现在并没有一个专门针对数据的逻辑一致性进行检测的方法。
在本文中,我们首先分别对关联规则挖掘的研究与支持向量机(SVM)的研究作一个简要的概述,主要是对关联规则的挖掘算法以及SVM技术中常用算法作一个描述。然后,根据数据的逻辑一致性的概念,提出一个通用的数据的逻辑一致性检测模型。接下来,分别就标称型数据与数值型数据提出基于关联规则的标称型数据的逻辑一致性检测模型以及基于SVM的数值型数据的逻辑一致性检测模型。在两个模型中,都分别做了仿真实验来验证模型的有效性。