论文部分内容阅读
在当今的基因组时代,已经产生了大量与基因相关的生物数据,在线人类孟德尔遗传数据库(Online Mendilian Inheritance In Man,OMIM)便是其中之一。随着生物信息学的发展,计算基因之间的相似性,进而对基因之间功能关系的挖掘成为新的关注点。作为相似性的一种度量标准,基于本体结构的语义相似性是一个重要方面,它能够很好的反应基因之间的功能关系。人类对疾病的重视逐渐加强,寻找治疗疾病的新途径成为热点,同时越来越多的人将目光锁定到致病基因上,希望从基因层面寻找突破口。因此,我们需要计算致病基因之间基于疾病表型的语义相似性,从而对致病基因之间的致病性关系进行挖掘,进而促进疾病领域研究工作的进展。目前,基于疾病表型计算致病基因语义相似性的研究工作还没有系统开展起来,也没有用于实现这一功能的工具。人类表型本体(Human Phenotype Ontology,HPO)是包含人类疾病与致病基因相互关系的重要本体,其数据来源于OMIM。本文对基于疾病表型计算致病基因语义相似性的方法进行了分析,并且实现了两个具备该功能的软件包HPO.db和HPOSim。HPO.db软件包整合了HPO中的数据,可以查询疾病表型及其层次结构信息;HPOSim软件包包含众多方法,可以用于计算致病基因的语义相似性。经过实验验证,本文设计并实现的软件包能够真实、正确的计算致病基因的语义相似性。