贝叶斯方法用于多关系数据挖掘的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zhaojie25
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多关系数据挖掘(MRDM:Multi-Relational Data Mining)的研究领域涉及多个学科,它在由多张表构成的关系数据库中进行知识发现。挖掘由复杂/结构化对象构成的数据也属于该研究范畴,因为在一个关系数据库中,要把这些目标数据进行标准化表述需要用到多张表。多关系数据挖掘旨在将一些已存在的并较为成熟的学科知识整合在一起,如归纳逻辑程序设计(ILP:Inductive Logic Programming),知识发现(KDD),机器学习,关系数据库等等,以此来为挖掘多关系的数据生成新的方法,并为这些新的方法生成可用于实践的应用软件。 传统的数据挖掘算法是在数据库的一张单一的表中查找模式。然而在现实应用中,把多张表中的数据挤压进一张表需要花费大量的心思和工夫,而且还可能造成信息的丢失。现在,多关系数据挖掘的时代已经来临了。 本文在传统数据挖掘的算法基础上对多关系数据挖掘的主要研究方法进行了介绍和比较,然后从分类的效率和正确率出发,对各种基于贝叶斯原理的方法进行了仔细研究并将之应用到多关系数据挖掘中。 第一章是绪言,首先简要介绍了多关系数据挖掘的定义,然后根据它的研究意义和研究范畴分析了它的应用现状。最后是论文的组织结构。 第二章对传统数据挖掘技术的概念,过程以及一些分析方法进行了综述。 第三章介绍了多关系数据挖掘技术的常用方法,包括ILP、多关系关联规则、多关系分类、多关系聚类等等。 第四章开始对多关系数据挖掘中的分类算法展开了仔细研究。本章主要是运用各种贝叶斯方法到多关系分类的规则连接中,先后讨论了朴素贝叶斯、TAN、DLBAN各自的优缺点,并用CLP实现了完整的贝叶斯分类器。 第五章提出了一种基于语义关系图的多关系朴素贝叶斯分类器,该方法将三种技术:语义关系图,元组标识传播,多关系朴素贝叶斯相互融合,共同实践应用到多关系的分类算法中,再经实验证实了它的高效性和高正确率。 第六章是对全文的总结和对未来研究工作的展望。
其他文献
股权出资是出资形式问题,属公司资本制度范畴。股东出资制度的价值和功能在很大程度上是与公司资本制度的价值和功能相一致的。从严格的出资法定主义到合理限定的出资自由主
我国对于作为第三次工业革命最具代表性技术之一的3D打印技术还处于探索阶段。针对材料选择、尺寸限制、安全性检验等阻碍推进3D打印技术在我国建筑领域应用的重大障碍,通过
本文通过文献资料法、调查访问法、比较法、逻辑分析法、数理统计法等研究方法,对湖北省普通高等学校体育院(系)体育教育专业教育实习现状从实习模式及实习模式下的实习形式
为了表征建筑保温砂浆抗压强度结果的准确性,采用测量不确定度评定方法,通过建立抗压强度的测量模型,研究了各测量不确定度分量对检测结果的影响程度。研究结果表明,建筑保温
校园外部空间是高校师生日常活动的重要场所,宜人的小气候环境能够增加校园空间活力,提升空间品质。以天津高校老校区为例,通过实测及回归分析探究夏季不同影响要素与校园外
时间管理是个体在对时间价值和意义认识的基础上,在活动和时间关系的监控和评价中所表现出来的心理和行为特征。时间管理倾向是从个体支配和利用时间的人格特质的角度提出来的
针对北方地区核桃受晚霜危害制约生产效益的问题,在渭河平原中部选择避晚霜品种及适宜的授粉品种,对12个早实核桃品种物候期进行了观察。结果表明:不同早实核桃品种物候期各
变压器室内的元器件运行时会产生大量的热,使得室内温度升高,需及时排出热量。为了研究不同送风方式对散热性能的影响,基于FLUENT软件对某变压器室散热方式进行了数值模拟研