论文部分内容阅读
伴随社会经济急速发展而来的生存环境的日益恶化,冠心病的发病率和死亡率直线升高,已经成为导致人类死亡的重大疾病之一。辨证论治是冠心病中医诊疗的基本方法,利用科学方法对冠心病中医证型进行辨证,有利于挖掘冠心病诊疗的规律和联系。贝叶斯分类是数据挖掘中重要的分类算法,因为其简单可靠的特点已经在众多领域得到运用。所以,利用贝叶斯分类方法进行冠心病中医证型识别,对于冠心病的辨证论治和用药具有现实意义。本文以冠心病中医诊断为背景,以朴素贝叶斯分类器为基本研究对象,主要从属性扩展和属性加权两个方面对朴素贝叶斯分类模型进行改进。并将提出的改进算法应用到UCI数据集以及处理后的冠心病数据中,通过实验证明其准确性和有效性。具体研究工作为:(1)属性扩展方面。本文选择性能优秀的隐藏的朴素贝叶斯分类算法(HNB)进行改进,提出了基于m估计的改进型HNB算法(HNB-M)和基于强属性的改进型HNB算法(SAHNB),这两种方法都一定程度上放松了条件独立性假设也避免了网络结构学习的复杂性。(2)属性加权方面。根据各个属性对于最终决策分类所发挥的作用不一致,通过赋予各个属性相应的权值来改进贝叶斯分类的性能。本文引入统计学中的Kullback-Leibler距离来衡量属性的重要度,提出基于KL距离的加权朴素贝叶斯分类算法(AWNB-KL),提高了朴素贝叶斯算法的性能。(3)实际运用方面。首先对冠心病数据库进行预处理,建立适合挖掘的数据仓库。其次,设计实现了本文所依托的项目,即基于智能技术的冠心病中医辅助诊疗系统。最后,将改进算法应用到冠心病中医辨证诊断中,实现了冠心病中医诊断模型。