论文部分内容阅读
微小RNA(microRNA,简称miRNA)是由内源性、发夹形转录物产生的,长度约为19-25个核苷酸长度的非编码单链RNA。miRNA通过与靶基因mRNA的碱基配对,诱导mRNA的降解或者抑制其翻译。研究表明,miRNA在生物调节途径中发挥着关键的作用,包括细胞的发育,增殖,分化,凋亡,信号传导等。因此,miRNA的异常表达将会导致众多疾病的发生。目前,根据文献可知,与miRNA相关的疾病有:癌症,心血管疾病,代谢性疾病,自身免疫性疾病等。随着生命科学技术的发展,越来越多的miRNA被发现,然而只有少部分miRNA被证实与疾病相关,大量的miRNA生物学功能仍需要研究人员去挖掘。因此,利用生物信息学的方法,对miRNA的功能进行预测,从而关联与其相关的疾病信息显得十分重要。基于以下假设:(1)miRNA在基因组中往往成簇存在,一簇或家族的miRNA在很大程度上共表达,发挥着相似的生物功能;(2)miRNA核苷酸序列(特别是种子区域)与二级结构在进化过程中具有高度保守性;(3)隶属于同一家族的miRNA通常具有一致的序列结构和相似的生物学功能;(4)功能相似的miRNA往往关联相似的疾病,本文结合前人研究成果,从miRBase与HMDD数据库中分别得到miRNA核苷酸序列、发夹结构和miRNA-疾病关联信息,主要完成:1.根据miRNA的成熟体序列与二级结构,构建miRNA的结构相似性,提出基因簇判别法,将未知家族的miRNA判别到相应的家族中,根据miRNA家族功能预测新miRNA的生物学功能。2.进一步精确miRNA结构相似性网络,结合Wang等人提出的miRNA功能相似性网络,构建更精确的miRNA全局相似性网络。将新的miRNA网络应用到不同算法中,发掘更多疾病关联的miRNA。通过K-折交叉验证,当miRNA家族成员数为3个及以上时,模型判别miRNA家族准确率达到80.74%。进一步地,利用留一交叉验证,将新的miRNA全局相似性网络应用到miRNA-疾病关联算法WBSMDA和RWRSMDA中,最终实验的AUC值分别达到0.8212和0.9657。此外,案例分析列举了部分实验结果,这些预测结果也获得当前大量文献支持。所以,无论是基因簇判别法,还是miRNA全局相似性网络(miRNA结构功能相似性网络),均为miRNA-疾病关联预测研究提供有利的工具。虽然更确切的结果还需实验的验证,但是本研究的工作为生物实验验证提供了方向,节省了更多的资源。