基于PPI的蛋白质复合物发现算法的研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:mingxing020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质复合物是由多个蛋白质相互结合在一起的组织。生命活动由这些复合物来推动,因此研究蛋白质复合物的具体作用在生物领域具有非常重要的意义。然而,目前的生命科学领域在对这些复合物的识别需要相当大的时间成本和机器成本。由于现在拥有丰富的蛋白质相互作用网络,复合物可以看成是该网络上的社区。在相互作用网络上使用数据挖掘中社区发现的一些算法能够辅助识别这些复合物,以达到减少成本的目的。因此,基于蛋白质相互作用网络的复合物识别是一项有意义的研究课题。现有的蛋白质复合物识别算法一般基于图的网络拓扑结构,结合子图挖掘或者特征学习等数据挖掘方法来识别这些复合物。但是这些算法往往很难完全考虑到蛋白质复合物的复杂性。有些算法只能考虑图密集区域的复合物而忽视稀疏区域的复合物,有些算法容易遗失部分复合物中的蛋白质或者产生冗余的蛋白质。因此,本文基于前人研究的这些缺陷,提出了两个更有效识别蛋白质复合物的算法:第一个算法基于基本的寻找初始聚类再向外扩张的思想。为了得到有效的初始聚类,基于重启型随机游走能够得到一个网络图中所有节点之间的相关联程度,本算法将那些与某个节点联系紧密的节点组合成一个初始聚类,并对这些初始聚类进行去冗余操作形成真正的初始聚类。然后从这些初始聚类出发向外扩张成最后的复合物。在这个过程中,为了解决蛋白质复合物中的某些特殊边缘蛋白质,本文结合其他扩张公式的优缺点,提出新的容易控制聚类大小的有益密度扩张公式比较方法。同时在扩张后的复合物基础上,过于相似的会合并在一起,但是会保留某些特殊的复合物。第二个算法同样基于初始聚类扩张的思想,基于重启型随机游走的结果,通过特定阈值的设计形成有一定规模的初始聚类,本算法认为某些区域内的最大的初始聚类一定程度上可视为这一部分的中心区域,将其他有相似节点的初始聚类都删去作为去冗余操作。最终得到一些互相正交的有代表性的真正初始聚类。在此过程中会产生很多剩余节点。由于重启型随机游走的结果节点之间的关联程度是一定的,因此可以根据这些剩余节点到真正初始聚类内所有节点的平均关联程度的大小来分配这些剩余节点以得到最终的复合物结果。实验在几个著名的酵母细菌蛋白质相互作用网络上进行,本文提出的两个算法都表现出了较好的复合物识别能力。
其他文献
琼胶酶是一类能够降解琼胶,生成琼胶寡糖的糖苷水解酶。它降解琼胶产生的琼胶寡糖,具有多种生理活性,在食品、药物、化妆品等领域具有广泛的应用前景。本课题从实验室保藏的
钙钛矿材料由于极好的光电特性,使得其太阳能电池器件的光电转换效率在过去的十年间从3.8%迅速提高到24.2%。甲脒(FA)碘化铅(FAPbI3)钙钛矿材料由于其良好的光捕获性能、极长的载流子扩散长度和优越的热稳定性而更适合光伏应用。鉴于此,本文先后采用3种不同的方法来制备高效率、高稳定性的基于α-FAPbI3的FA基钙钛矿太阳能电池。首先,本文采用“模板辅助法”制备超纯相、高质量的α-FAPbI3
由于储层是非均质的,在相同射孔参数的情况下,必然造成非均质性对不同射孔段和同一射孔层段的影响,其吸水能力是不一样的,油水推进也会是不均一的;在渗透率差异较大的井中,渗
我国钨资源开发利用较早,钨冶炼企业较多。然而到目前为止,我国钨冶炼生产过程的自动化水平仍然较低,只有厦门钨业等大型钨冶炼企业建设了基于DCS系统的钨冶炼生产过程自动控
葡萄花及敖包塔油田位于大庆长垣南部的葡萄花及敖包塔构造上。黑帝庙层发育在嫩江组三、四段地层中,属松辽盆地上部含油组合。其埋深小于700m,为浅层气藏类型。葡浅701井、
目的:通过pAdEasy腺病毒系统构建红色萤火虫荧光素酶报告基因,结合Tat-Ag2S QDs联合标记mMSCs。建立近红外二区荧光和生物发光联合成像技术,并应用于移植干细胞在急性肝损伤
异喹啉酮化合物广泛地存在于自然界,它不仅是构成许多天然产物的基本结构单元,同时它还具有独特的生物活性和药理活性,所以一直以来都是众多化学家研究的热点之一。本文以邻
蛋白质是生命的基础物质,构成细胞的基本有机物,是生命活动的主要承担者。蛋白质不仅与其它化合物结合,蛋白质自身结合也有重要的意义,蛋白质与蛋白质之间的交互对生命活动有
随着云服务结构日趋复杂,在云中发现的漏洞也越来越多,目前在部署最为广泛的基础设施云平台OpenStack中就已发现173个漏洞。而云环境的多租户模式为攻击者攻击其他云租户提供