针对SW26010众核处理器的单精度矩阵乘算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：ykq1999

【摘要】

：

【作者】

：

武铮许乐安虹金旭文可

【机构】

：

中国科学技术大学计算机科学与技术学院

【出处】

：

小型微型计算机系统

【发表日期】

：

2020年01期

【关键词】

：

众核处理器矩阵乘计算机系统结构高性能计算并行算法

【基金项目】

：

国家重点研究开发项目（2018YFB0204102）资助；

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

矩阵乘作为许多科学应用中被频繁使用的关键部分，其计算量巨大且稠密的本质，使得高性能计算领域中矩阵乘并行算法的研究一直是经久不衰的热门话题。随着我国自主研发的申威众核处理器SW26010在科学计算和人工智能领域的快速发展，对面向SW26010众核处理器的高性能矩阵乘算法提出了迫切的需求。针对SW26010众核处理器的体系结构特征，首次对单精度矩阵乘实现进行了深入探讨，提出了3种不同存储层次的高性能并行算法。在进行算法设计时，计算方面，结合该处理器的从核双流水，从汇编层面手动控制核心计算任务的指令序列，保证了高效的指令级并行；访存方面，综合考虑了有限片上存储资源的有效使用，以及访存任务和计算任务的交叉并行，实现了计算访存的平衡以及算法整体性能的提升。实验结果显示，与该处理器上最先进的官方数学库xMath中的单精度矩阵乘实现相比，运行时峰值性能提升了6.8%，达到了理论峰值性能的86.17%；在基于不同矩阵乘场景的通用性比较中，95.33%的场景中性能更高，最高性能加速比达到247.9%，平均性能加速比为61.66%。

其他文献

乐清市“医保护士”新政的推广实施

乐清市积极探索医保基金治理新模式，推出“医保护士信用体系建设”新政。本文对温州乐清市医保护士信用体系建设试点工作进行总结，阐述医保护士信用体系在医保基金监管中发挥的作用、取得的初步成效，并提出相关建议，为进一步完善医保护士信用体系建设，推进医保治理现代化提供参考性意见。

期刊

医保护士信用体系医保基金监管

首台E级超算“前沿”问鼎Top500

据报道，国际超算组织宣布，美国橡树岭国家实验室的超级计算机“前沿”在2022年国际超算Top500榜单中拔得头筹，成为现今世界上运行速度最快的超级计算机，其算力高达每秒1.1百亿亿次，也是目前在国际上公告的首台每秒能执行百亿亿次浮点运算的计算机。普通笔记本电脑每秒只能进行几万亿次运算，而“前沿”的运行速度是其一百多万倍。百亿亿次超级计算机也被称为E级超级计算机，每秒计算次数超过1 018，它的研制

期刊

决战崛起——中国超算强国之路（一）

超级计算,是现代科技发展领域中支撑起现代科技大厦的一根重要支柱,是国家科技竞争力的重要标志。从国家安全战略领域到人们日常生活,都离不开超算技术的支撑。超级计算机,是名副其实的“国之重器”。本刊从国防科技大学出版社《决战崛起——中国超算强国之路》一书中节选了部分章节,展现中国超算早期艰难的崛起之路,以此向中国超算全体科研人员致敬。

期刊

策略性回应还是实质性响应？碳排放权交易政策的企业绿色创新效应

全球气候变暖已成为世界各国持续关注的重要环境问题。中国为应对全球气候变化挑战并推动低碳发展而制定了一系列减排政策。基于此，以中国碳排放权交易政策为例，采用2008-2019年中国2670家沪深A股制造业上市公司的面板数据，使用双重差分法实证检验碳排放权交易政策对企业绿色创新的影响。结果发现：（1）中国的碳排放权交易政策促进了试点地区的企业绿色创新水平，而且，碳排放权交易政策促进了试点地区企业实质性

期刊

绿色创新策略性实质性碳排放权交易政策

遵义会议后以毛泽东同志为核心的党中央权威的确立研究（1935-1945）

学位

《巴赫金全集》（七卷本）修辞理论研究

学位

浅析天津市中考体育现状及发展

本文运用文献资料法、逻辑分析法对天津市中考体育发展进程中不同时期的实施方案进行研究。分析出天津市中考体育在分数占比、考试项目、组织实施中存在问题,并给出提升路径,为天津市中考体育的发展提供一定的参考。

期刊

天津市中考体育发表

林译冒险小说与清末民初“少年”的修辞语义及其文化影响

学位

贸易开放、财政政策波动性与企业创新

本文旨在通过财政政策波动性的视角研究贸易开放对于企业创新的影响。自从2001年底我国正式加入WTO以来,全球化进程大大加快,以企业专利申请和授权数量为例,世界上绝大多数国家的创新能力都有了明显提高。随着世界贸易开放水平的不断提高和各国之间贸易自由化程度的不断加深,各国之间的竞争加剧,尤其体现在技术创新层面和高端制造领域竞争日益激烈,如何快速提高我国的创新能力,成为了当前亟需解决的严峻问题。与此同时

学位

贸易开放政策企业创新财政政策波动性反事实框架机器学习

托马斯·萨金特经济思想研究

学位

针对SW26010众核处理器的单精度矩阵乘算法

与本文相关的学术论文