论文部分内容阅读
中医药是中华民族具有几千年传统的医药学,积累了丰富的经验,拥有了浩瀚的文献,中华民族繁衍生息到现在充分证明了中医顽强的生命力和实用价值。目前国家对中医药信息化的重视,建成和完善了大量的中医药数据库。如何更好的利用这些数据,如何利用计算机来加快发现新知识的过程,是中药信息化研究的重点。 数据挖掘与知识发现技术可以从大量的数据中抽取出隐含的、以往未知而又非常有意义和有用的信息。本课题继续南京中医药研究所信息平台的建设,将数据挖掘与知识发现技术应用到中药药组、药队的挖掘中,设计实现了中药配方系统,为新药研发人员提供良好的决策支持,促进中医药更快地向现代化、国际化发展。 本文做了如下四方面的工作: 1、中医药原始数据的不规则,使数据挖掘难以进行。提出了一套数据预处理方法,结合数据归约技术、聚类方法、模糊集理论,成功将中药专利数据规范化,为数据挖掘算法提供了模糊化表示的数值型数据。 2、根据中医药数据的特点及课题的目标,在FP-growth算法的基础上进行了一系列改进。在同一树中引入多维结点,提出了混合维TCM_FP树及其建树算法。采用了中药的模糊隶属度作为结点的支持数,为规则增加了数值型的特性。 3、提出了TCMA算法用于挖掘TCM_FP树中的维间最大频繁项集。在中药维度上应用了双支持度,既缩小了挖掘的范围又提高了规则的意义。针对最大频繁项集提出了全新的搜索策略,省略不必要搜索的结点及其条件模式基与条件模式树的构造。算法切合中药TCM规则挖掘的实际意义,又比FP-growth挖掘算法有更高的运行效率。将挖掘出的TCM规则作为知识库,为中药的配方提供知识基础。 4、设计实现了中药配方系统。将TCMA算法应用于中药数据中,设计实现了中药挖掘器。结合中药方剂配伍理论及组方过程,提出了方剂配方的计算模型,采用自定义的U连接操作生成主方,经配伍知识修正,四气、五味调整,成功为用户开出治疗特定症状的量化中药方剂,为医生及中药研发人员提供计算机辅助决策支持。