基于GPU的高性能并行优化算法研究

被引量 : 14次 | 上传用户：xxhaizi

【摘要】

：

随着高性能并行计算设备的日益普及,特别是高性能图形处理器(GPU)的迅猛发展,基于GPU高性能计算平台的并行优化应用服务解决方案引起国内外研究学者的极大关注。由于传统CPU

【作者】

：

李繁

【发表日期】

：

2014年01期

【关键词】

：

GPU并行计算随机数生成器可扩展模型蚁群优化迭代式分割与合并

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着高性能并行计算设备的日益普及,特别是高性能图形处理器(GPU)的迅猛发展,基于GPU高性能计算平台的并行优化应用服务解决方案引起国内外研究学者的极大关注。由于传统CPU、计算集群在计算资源以及能耗方面的限制,以及各类科学工程优化问题对于并行计算需求的不断提升,基于高性能并行计算的扩展模型、仿真计算、算法优化以及数值计算已经成为当前高性能计算的研究热点。高性能并行优化算法作为衔接底层并行计算平台及上层应用服务的关键部分,在算法性能的优化以及应用空间的扩展方面仍然存在严峻挑战和亟需解决的问题,需要对算法优化和数值计算问题的方法和技术不断提高和完善。基于此,本文将重点进行高性能并行计算随机数生成、智能算法优化和数值计算算法等方面的研究创新。针对随机数生成器、蚁群算法、最小平方估计等问题,采用GPU扩展加速比模型、GPU局部优化等技术,设计并提出三个关键的并行优化解决方案。主要研究内容和创新点如下：(1)针对传统随机数生成速度较慢及加速优化模型扩展性较差的问题,通过对当前可扩展加速优化模型及随机数生成器机制的分析总结,给出一种考虑存储层次的GPU可扩展加速比优化模型,并基于该模型提出了一种简单的高性能并行计算随机数生成算法(简称为CUDA-RNG),该算法充分利用了GPU间的协同计算能力,最终可以生成高效率的随机数序列。实验结果表明,CUDA-RNG算法能够在连续计算运行时达到189.32倍的生成速度,且具有很小的内存负载开销。(2)针对蚁群算法在大规模的最优化问题中难以得到最优解的问题,受蚁群算法在本质上具有并行性特点的启发,着重研究如何在GPU并行计算环境下提高蚁群算法的性能及效率。通过对TSP(旅行商)问题的蚁群算法建模,提出一种新的基于CUDA(统计算设备架构)的蚁群优化算法,简称为GACO。该算法结合了MMAS(MAX-MIN Ant System)和ACS(Ant Colony System)的共性特点进行混合信息矩阵更新、动态构建最短邻接路径和多路蚁群分布等优化策略。最后对GPU的性能优化方案做了分析,通过使用这些优化策略使得该算法跟同等类型的算法相比具有更高的速度和质量。实验结果表明,本文提出的GACO算法性能在搜索加速度上分别比ACS、MMAS要高出40.1倍与35.7倍。(3)针对在数据规模较大情况下利用奇异值分解求最小平方时的时间消耗和内存空间代价过大的问题,提出了一种基于GPU的迭代式分割与合并的奇异值分解最小平方估计法,简称为IDMSVD。该算法可以有效的改善对于大型数据利用奇异值分解求最小平方问题时的运算时间和内存空间。最后在GPU的CUDA计算架构的中进行了实现,通过实验验证了算法的有效性。本文所提出的算法具有普适意义,能够轻松地转移到其他的并行计算设备上,比如多核CPU或者大规模集群设备。更高性能的加速平台如CPU和GPU混合构架(或GPU集群)、GPU和FPGA(现场可编程门阵列)混合构架等都有望应用到高性能并行优化算法的研究中。

其他文献

中印承接离岸服务外包的对比研究

随着全球经济一体化的发展和互联网的进一步普及，世界各国的服务外包发展迅速，增长比例普遍高于国内其他产业的增速，对GDP的贡献逐年增高。21世纪初，我国为很多欧美国家的大型企

学位

中国印度离岸服务外包对比

以白云石和菱镁石为原料真空金属热还原制取金属镁的研究

金属镁及其合金具有比强度高、导热和电导性能好、阻尼减震、电磁外屏蔽、易于机械加工和容易回收等优点,应用十分广泛,已成为仅次于钢铁和铝的第三大金属工程材料。目前的生

学位

金属镁白云石菱镁石镁化白云石真空热还原CaO·2Al2O3氧化铝溶出氢氧化铝

银行金融IC卡城市公交应用系统设计与实现

随着工、农、中、建、交、招商、邮储和各大商业银行大力推广发行金融IC卡以及培育受理的市场环境越来越成熟,人行推行PBOC2.0,3.0的银行芯片卡,发行银行金融IC卡已经成为各

学位

城市公交应用银行金融IC卡脱机消费PBOC2.0电子现金

A银行陕西省分行信用卡营销策略研究

近年来,随着国内外资本市场的飞速发展,利差水平的缩小以及利率市场化进程的加快,各大商业银行只依靠传统业务来增加利润的路子越来越窄,国内外银行纷纷把主攻方向放在发展中

学位

商业银行信用卡营销策略

论不动产交付在物权变动中的效力

交付是不动产交易中的重要环节，但从我国目前的相关法律法规及司法实务来看，不动产交付在物权法上并不具有确定的法律效力。不动产登记的重要性，已经为我国民法理论界普遍认可，而

学位

不动产交付物权变动效力中间型权利

清热解毒化浊片对ETM兔肝损伤TLR4/NF-κB信号通路及下游因子作用的研究

目的：从血液细胞分析、病理形态学、免疫组化等方面研究清热解毒化浊片对ETM兔肝损伤TLR4、NF-κB、TLR4/NF-κB信号通路下游因子IL-2、IL-6、IL-8、1L-10以及血常规、血清内

学位

清热解毒化浊片ETM肝损伤TLR4NF-κBIL-2IL-6IL-81L-10

轨道交通影响下的城市中心区更新策略研究

近些年城市轨道交通如火如荼建设,其影响下的城市中心区更新逐渐得到越来越多的关注。而亚洲发达地区是世界上公认的城市轨道交通建设成功地区,也给当地城市中心区更新带来许

学位

城市轨道交通城市中心区城市更新亚洲

X新能源公司组织管理案例研究

随着中国经济的快速发展,多数行业都已经成为竞争的红海,企业与企业之间,尤其是中小企业之间的竞争已经由抢占市场的直接对抗演变为内部管理的精细化对决。市场环境的变化日

学位

组织管理组织变革组织结构设计

移动互联网环境下中国移动L市分公司转型研究

随着移动互联网的发展,通信技术不断进步、用户需求千差万别、行业竞争愈演愈烈。在这种形势下,传统电信运营商的优势地位也开始受到威胁。为适应移动互联网环境下电信市场的

学位

移动互联网电信运营商转型L市移动公司

碳酸钙晶须增强泡沫混凝土的试验研究

泡沫混凝土作为一种无机建筑保温材料,具有质量轻、保温隔热好、防火性能优良等特点,已在我国建筑工程中得到一定程度的应用。但是由于泡沫混凝土存在一定缺陷(强度偏低、收

学位

泡沫混凝土碳酸钙晶须增强机理

基于GPU的高性能并行优化算法研究

其他学术论文