基于拓扑和序列的多生物网络比对算法的研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:mytony
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量技术的发展使得生物数据呈指数级增长,生物数据的分析需求也随之日益增长。生物数据通过构建网络,根据网络结构对网络进行搜索、比对和聚类能够发掘网络中的隐藏信息,这对于生命科学的研究具有重要意义。蛋白质作为一切生命的物质基础,参与了生命过程的各个环节,分析不同物种的蛋白质相互作用网络,对于理解蛋白质功能、物种进化关系和疾病机理等具有重要意义。虽然目前蛋白质相互作用网络可用于许多物种,但许多物种中的很多的蛋白质功能仍然未知,因此通过比对进行生物学知识转移是解决这个问题的方法之一。序列比对通过比较不同蛋白质的序列片段确定相似性信息,蛋白质相互作用网络与其类似,通过比较不同物种的蛋白质空间结构获取蛋白质的相似性。通常认为具有相似网络结构或较高序列相似性信息的蛋白质,有较高概率是具有相同功能的,且许多文献的实验表明加入序列相似性信息构建的比对结果质量更高,生物功能一致性更好,因此本文通过蛋白质的拓扑结构信息和序列相似性信息相结合的方式生成比对。由于随着比对网络数的增加,算法的计算难度和复杂性也随之增大,为了构建高效的比对算法,本文的主要工作如下:(1)以构建高效比对为前提,提出基于种子-扩展框架的全局多对多的多网络比对算法ACCMNA。通过考虑蛋白质相互作用网络的度提高比对结果的拓扑质量,根据蛋白质的序列相似性信息构建k分加权相似图,并采用聚类方法搜索拥有最大加权和的节点候选簇来提高比对结果的生物质量。每一次迭代过程中将已比对的节点作为种子,在其邻居节点中进行扩展搜索,并采用贪心算法在每次迭代中产生比对簇。真实网络和合成网络数据集上的实验结果表明ACCMNA算法产生的比对结果在拓扑保守性和生物一致性方面都能够达到较好的效果。(2)为了解决比对过程中产生局部最优的问题,本文提出基于模拟退火的全局一对一多网络比对算法SAMNA。该算法同样采用拓扑和序列相结合的方式,在序列相似性信息构建的k分加权相似图中通过搜索加权最大团的方式构建候选簇集合。通过改进NetCoffee算法中模拟退火部分的状态更新方式,使其扩展到对于包含多个节点的候选簇的更新方法,使得不同网络间的节点联系更加紧密。合成网络和真实网络数据集上的结果表明,SAMNA算法能够产生较高生物功能质量的比对结果,且在比对两个网络时,产生的比对结果在生物意义上也要优于成对网络比对算法的比对结果。(3)基于SAMNA算法在拓扑质量方面的缺陷,在SAMNA算法中融入种子-扩展策略提出改进算法SE-SAMNA算法。通过在模拟退火过程中的状态转移步骤中融入种子-扩展策略,将上一轮迭代产生的候选簇作为种子,在其种子节点的邻居节点中进行扩展,随机选取一个包含其邻居的候选簇进行状态更新,这在迭代过程中提高比对的保守边比例,能够提高比对的拓扑质量。合成网络和真实网络上的实验结果表明,SE-SAMNA算法能够在不过度牺牲生物质量的前提下,明显提高比对的拓扑质量。
其他文献
基于生物原理的神经网络在深度学习领域应用越来越广泛。深度神经网络赋予了各种智能设备新的发展空间。但深度模型往往拥有庞大的参数量并需要昂贵的计算力,这些模型难以在有限的计算、存储资源以及续航能力的智能终端设备上运行,这使得神经网络在终端部署成为新的难题。针对上述问题,本文深入研究生物进化选择原理,提出一种全新网络算法,并基于已有模型压缩方法,研究出一种新型优化学习算法。本文的工作可以分为以下三个方面
虎镇五毒纹样作为中国传统服饰纹样的重要组成部分,是自古以来传统童装上运用最为广泛的纹样之一。在我国传统服饰纹样中吉祥纹样一直占据最为重要的地位,而虎镇五毒纹样作为主要运用于童装的吉祥纹样在中国重嗣传统观念的影响下经过千百年的演变逐渐形成为一种极富文化价值和艺术价值的纹样体系。随着人们对传统文化的传承和保护意识逐渐加强,现代服装设计也越来越注重传统服饰纹样的提炼和使用,虎镇五毒纹样也处于不断发展创新
三维重建的目的是从二维图像中恢复目标的三维空间结构,该技术常常被应用在自动驾驶、虚拟现实、环境感知等领域。随着深度学习的发展,通过对训练数据的有效学习,深度神经网络能够拟合二维图像与三维结构之间的映射关系,从而实现了从图像中重建目标三维模型的目的。基于深度学习的图像目标三维重建一般涉及相机参数估计、图像深度预测和目标点云求解等过程,本文的主要研究内容包括:1)构建了一组多视点变焦距的虚拟合成数据集
随着信息技术的发展,网络用户不再仅仅是信息的受众,而是集创作者、传播者与观看者为一身。网络空间的自由氛围激发了公众的表达欲望和创作兴趣,用户出于兴趣、社区认同感等目的在网络空间发布创作内容。用户创造内容具有促进文化与经济发展的作用,是用户实现表达自由的重要形式,深受公众欢迎,已经形成不可阻挡的发展趋势。用户创造内容中有大量未经许可使用他人作品而产生的内容,可能侵犯他人著作权。著作权法如何处理用户创
中国优秀传统服饰文化,是中国丰厚历史文化中不可或缺的组成部分,代表一个时代的缩影和更迭,反映当时的社会风尚和精神风貌。近年来,中国优秀的传统服饰文化元素不断涌现在国内外重大秀场中,尤其是一些高级服饰定制品牌,打造出别具一格的中国风。作为优秀的传统服饰文化的发祥地,需要我们借着优秀传统服饰文化风靡国内外的东风和浪潮,抓住承扬优秀传统文化的机遇,秉持复兴中国优秀的传统服饰文化的理念,奋力前行。本文以现
长期以来,基于维护债权人与债务人的利益、防止国有资产流失等考量,我国立法对流质条款均予以明文禁止,但流质条款的效力在学界的争议却从未停止。我国《民法典》401条和428条分别对抵押和质押中的流质条款做出了规定,对流质条款之转移抵押(质押)财产所有权的效力仍予以否定,但肯定了其具有担保的效力,即担保权人可依法就抵押(质押)财产获得优先受偿权。然而,如何“依法”实现优先受偿权仍面临诸多具体问题,特别是
国家战略层面提出了对创新型人才的需求,未来的社会发展对每个个体提出了创新意识、创新能力的要求。在这样的大背景之下,我国的创造力教育正在蓬勃发展,本研究关注小学阶段的创造力教育(统称为小学创意思维课程)也在近十年涌入了大量的关注。该类课程不同于传统科目被应试教育所限制,相比分数,其体验性和学生自身的获得感更为重要。因此本课题尝试解答如何通过设计系统地提升课程中学生的情感体验这一研究问题。本研究通过对
近年来,随着国民医疗水平的不断提升,医疗影像设备在基层医院的不断普及,医学图像数据已经成为医生做出病理诊断的重要依据,利用计算机技术对医学影像数据进行处理也随之引起了研究人员的极大兴趣。随着深度学习技术的不断发展和计算机硬件水平的不断提升,基于计算机技术的医学图像辅助诊断技术得到了长足发展。由于医学图像在采集过程中受到机械和环境的影响,往往会在图像中引入噪声和金属伪影损坏图像的质量。因此,医学图像
迁移学习是通过利用源域的已标记数据中的知识来增强目标域中的模型性能,而目标域中只包含少量或没有标记的训练样本。因为在现实世界中人工标记数据需要耗费大量的人力和物力,所以利用已标记源域来辅助目标域任务可以大大减少人工标记的消耗。目前,主流的迁移方法假设源域和目标域包含相同的特征空间,而实际应用中收集具有相同特征空间的源域和目标域比较困难。因此,异构迁移学习的发展解决了这些局限性。异构迁移学习中源域和
控制器的性能优劣不仅决定控制系统能否达到期望目标,而且也直接影响整个工业过程的稳定与安全。当前,各类工业企业的计算机控制系统逐步完善,这给存储大量控制系统运行数据提供了条件。这些数据中包含着与设备特征、过程动态、系统工况以及控制器性能等相关的各类信息。如何充分利用这些数据,实现对在运行控制器的性能优化一直是过程控制领域的研究热点之一。课题针对实际中应用最广泛的PID控制器,研究基于数据驱动的不同结