基于多核架构的生物序列比对算法的设计与实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户：aigufeixi

【摘要】

：

生物信息学是计算技术在管理和分析生物信息数据上的应用。在生物信息学中，序列比对是一种计算排列DNA、RNA和蛋白质序列的方法，此方法用来划分序列间可能与功能、结构或进化关

【作者】

：

王磊

【机构】

：

重庆邮电大学

【出处】

：

重庆邮电大学

【发表日期】

：

2011年期

【关键词】

：

多核架构生物序列比对算法序列比对

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

生物信息学是计算技术在管理和分析生物信息数据上的应用。在生物信息学中，序列比对是一种计算排列DNA、RNA和蛋白质序列的方法，此方法用来划分序列间可能与功能、结构或进化关系有关的相似区域。序列的关系是可以量化的，并且它们之间的相似度也是可以评估的。这种相似度可以用来鉴定一个新发现的序列和一个已知基因之间的进化关系。如果相似度低，除非收集到足够的证据，否则它们的进化关系只能是待定的。序列比对已经成为分子生物学中的一项常规操作。今天，序列可以很容易获得，但是去比对已经得到的序列仍然是分子生物学中复杂的一部分。过去的几十年中，一系列的序列比对程序已经出现。它们中的大多数采用了基于动态规划思想的算法，这个算法由Needleman和Wunsch于1970年提出。　　 Needleman-Wunsch算法基于动态规划思想。这个算法的时间复杂度是O(n2)，这里的n是输入序列的长度。因为该算法需要执行与序列长度乘积规模相当的一系列操作，所以其计算耗费是相当高的。为了降低算法执行所需要的时间，我们很自然地考虑到这个算法的并行化设计。　　由于多核架构上编程简易且功能强大，因此适合用作高性能计算。进一步说，此架构有很好的价格/性能比率。很多任务都可以基于多核平台执行，并且执行效率显著提升。这篇论文工作的主要动机就是利用现有普通的多核架构的巨大的计算能力，实现一个序列比对的高效解决方案。OpenMP是一个可移植，可扩展的模型，它给基于共享存储器编程的程序员提供一个简单且灵活的接口，以此来开发从桌面到超级计算机平台都适用的并行程序。　　本文研究了生物序列比对算法及其并行化，主要研究内容如下：　　 1.介绍了多核架构以及OpenMP编程模型的一些基本知识。阐述了多核架构的特点，OpenMP模型的相关信息。　　 2.对双序列比对算法做了分析，指出了其优点与不足。并用Diagonal Wavefront算法结合OpenMP模型的特性对Needleman-Wunsch算法进行了并行化。　　 3.在Needleman-Wunsch算法并行化的基础上，研究了基于Needleman-Wunsch算法的Clustal算法的并行化。　　 4.通过比较Needleman-Wunsch算法和Clustal算法在单线程和多核系统下多线程并行执行的耗费时间，我们发现当计算的比对序列较长以及比对序列较多时，计算速度有较明显的上升。实验的结果证实了序列比对算法完全可以因并行计算而获得性能提升。实验结果同样说明了这样一个事实：要高效利用多核系统，并行执行线程的数量以及任务的分解是非常重要的。

其他文献

基于关联规则的数据挖掘研究及在医学上的应用

近年来,数据库技术得到了突飞猛进的发展,特别是关系数据库的应用,导致了海量的数据、有限的信息应用问题,引起了广大学者的重视,数据挖掘技术从上世纪九十年代应运而生,被用

学位

关联规则数据挖掘医学数据库技术

面向自由文本的信息抽取方法研究

随着互联网的广泛应用以及各种办公系统的无纸化，各种电子形式的文本文档正以指数级的速度迅速增长，如何从这些海量的文本文档中快速有效的找到有用的信息，成为信息检索领域的重

学位

信息抽取自由文本语义相似度依存分析隐马尔可夫模型

基于动态线性步长的双子群果蝇优化算法及其应用

果蝇优化算法(Fruit Fly Optimization Algorithm, FOA)是一种对果蝇在觅食过程中的行为进行仿真模拟从而总结得出的一种优化算法。FOA算法根据果蝇所在位置计算其相应的味道

学位

果蝇算法动态线性步长双子群旅行商问题0-1背包问题

模糊语义网的体系结构及其推理研究

语义网这个概念于2000年首次由Berners-Lee提出,以往Web技术中计算机主要扮演展现信息的角色,几乎不参与信息处理,忽略计算机信息处理的作用,一方面使得Web中庞大数据无法得

学位

语义网模糊本体FOWL演化具体关系抽象关系模糊语义网

基于基因分类的交互式遗传算法研究及应用

交互式遗传算法是一种通过人的主观评价得到个体适应度值的遗传算法。它将人的智能评价与进化计算有机的结合起来,突破了建立被优化系统的显式性能指标的限制,大大扩充了进化

学位

交互式遗传算法层次分类情感偏好

多体制调制解调实验系统的研究

在移动通信和通信产品普及的时代,通信原理已成为各高校电子信息工程、通信工程等专业的必修课。它的辅助教学实验课程具有验证理论知识,使理论知识转化成实际电路和培养学生

学位

调制解调软件无线电实验系统FPGA

基于密度的局部离群点挖掘算法研究

离群点挖掘作为数据挖掘的重要组成部分,能够从大量复杂的数据中找到小部分与其他数据相比最不一致、显著异常的数据点,这些异常点往往包含着非常重要的信息。本文通过研究现

学位

离群点挖掘LOF核聚类Voronoi图局部加权

基于PR-tree的多维关联规则的研究与实现

关联规则挖掘是数据挖掘的一个重要研究分支,以从大型数据库中提取知识的主要手段,有效地来解决“数据丰富、知识贫乏”的现状,因此具有较大的理论研究与应用价值。关联规则

学位

多维关联规则数据立方体PR-tree算法频繁谓词集频繁项目集

基于Split-Bregman方法的乘性噪声去除研究

噪声去除是图像恢复的主要内容之一,其主要任务是消除观测到图像中的噪声成分,从而得到理想的清晰图像。加性噪声的变分模型研究已经取得很大进展,而对于乘性噪声图像恢复问

学位

图像去噪乘性噪声Split-Bregman方法彩色图像

基于多核架构的生物序列比对算法的设计与实现

其他学术论文