数据挖掘算法及其在中药配方系统中的应用研究

被引量 : 9次 | 上传用户:gongxintao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医药是中华民族具有几千年传统的医药学,积累了丰富的经验,拥有了浩瀚的文献,中华民族繁衍生息到现在充分证明了中医顽强的生命力和实用价值。目前国家对中医药信息化的重视,建成和完善了大量的中医药数据库。如何更好的利用这些数据,如何利用计算机来加快发现新知识的过程,是中药信息化研究的重点。 数据挖掘与知识发现技术可以从大量的数据中抽取出隐含的、以往未知而又非常有意义和有用的信息。本课题继续南京中医药研究所信息平台的建设,将数据挖掘与知识发现技术应用到中药药组、药队的挖掘中,设计实现了中药配方系统,为新药研发人员提供良好的决策支持,促进中医药更快地向现代化、国际化发展。 本文做了如下四方面的工作: 1、中医药原始数据的不规则,使数据挖掘难以进行。提出了一套数据预处理方法,结合数据归约技术、聚类方法、模糊集理论,成功将中药专利数据规范化,为数据挖掘算法提供了模糊化表示的数值型数据。 2、根据中医药数据的特点及课题的目标,在FP-growth算法的基础上进行了一系列改进。在同一树中引入多维结点,提出了混合维TCM_FP树及其建树算法。采用了中药的模糊隶属度作为结点的支持数,为规则增加了数值型的特性。 3、提出了TCMA算法用于挖掘TCM_FP树中的维间最大频繁项集。在中药维度上应用了双支持度,既缩小了挖掘的范围又提高了规则的意义。针对最大频繁项集提出了全新的搜索策略,省略不必要搜索的结点及其条件模式基与条件模式树的构造。算法切合中药TCM规则挖掘的实际意义,又比FP-growth挖掘算法有更高的运行效率。将挖掘出的TCM规则作为知识库,为中药的配方提供知识基础。 4、设计实现了中药配方系统。将TCMA算法应用于中药数据中,设计实现了中药挖掘器。结合中药方剂配伍理论及组方过程,提出了方剂配方的计算模型,采用自定义的U连接操作生成主方,经配伍知识修正,四气、五味调整,成功为用户开出治疗特定症状的量化中药方剂,为医生及中药研发人员提供计算机辅助决策支持。
其他文献
本论文旨在运用句法生成法来构建及推导汉语的名物化结构。我们以分布式形态学为基本理论框架,采用其基本理论假设,即句法是生成词与句子的唯一引擎,主要研究了以下几个问题:
Robocup组织的目标是到2050年前构建一支仿人形的机器人足球队,使它能够战胜当时的人类世界冠军队。Robocup比赛在推动产、学、研结合方面有着显著作用和极大的意义。厦门大
汉语和塔吉克语分属汉藏和印欧语系,从客观的语言事实来看,汉语和塔语之间存在着很大的差别。从语义角度出发,汉语定语可以分为限制性和描写性两类定语,本文在此基础上将汉语
乡村基层政权建设是整个政权体系建设中最基础的一环,它直接关系到政权体系运行的效率。赣东北根据地在方志敏等人的领导下,根据中央指示精神,结合根据地的实际情况,逐步形成
<正> 现代教育思想已愈来愈多地重视对学生思维能力的培养、创造能力的挖掘。而思维能力的开发,与探究能力密切相关。因此,在化学教学中,应着力通过多种途径,注重对学生探究
为研究商场环境污染状况,该文对某商场购物环境进行了调查研究,发现该商场摊位货架大量使用了中密度纤维板,商场营业厅通风状况不佳;共选择6个检测点,对空气中污染物浓度进行
目的:选取非临床抑郁个体与健康个体,考察彼此间道德情绪判断任务中的差异。方法:对两组被试(26名非临床抑郁个体和26名健康人)采用道德判断任务。结果:非临床抑郁个体与健康
新加坡经济发展迅速,并一跃成为亚洲"四小龙"之一,该国与中国的政治、经济关系也在不断发展。本文以新加坡《海峡时报》对中国的报道为样本,从报道数量、报道主题、报道题材
本文在分析低风速风能利用策略的基础上,认为设计适合低风速发电的大型风电机组是必要的。机组设计中最主要的是叶片设计。本文在分析多种风力机设计理论基础上,认为动量理论
《人民日报》是中共中央机关报,报纸严谨可靠地发布中共中央和中国政府的最新动态,报道国内外大事,反映广大群众的民意诉求,是当今中国最具权威性、时效性,最有影响力的全国