基于多核架构的线程级并行关键技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:ua8722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路和微处理器体系结构的发展,多核处理器已经成为业界研究、商用的主流。在单芯片上集成多个相对简单、低功耗的单处理器内核,多核技术大大降低了处理器设计、验证的代价。如何应用多核处理器的并行能力,给当今的程序设计提出了新的要求。   多线程并行是应用多核处理器并行能力,加速串行程序执行的一个有效手段。已有一些编译工具可以辅助程序员对特定的应用进行自动并行化。这些特定的应用往往具备一定的可隔离计算,容易任务划分的特征。但是仍然有大量实际并行度较高的程序,由于存在指针、间接访存等模糊依赖,被划入编译器无法自动并行的范围,极大地限制了该类程序在多核架构上进一步挖掘并行加速比,也限制了现代处理器通过大规模增加核数提升性能加速比的发展思路。   推测执行及事务存储技术的提出,弱化了该类程序在编译器阶段的依赖分析,使得串行任务可以被任意地划分为多个子任务,以多线程的形式在多个不同的处理器核上并行执行。这种任意并行划分后的程序的执行正确性由特定的软硬件机制来保证。这无疑大大地简化了编译器在串行程序自动并行化上的工作。但目前来说,相关技术的研究仍然处于学术研究阶段,距离真正商用还有较大距离,仍有许多关键技术有待深入研究。本文从软硬件结合的角度选择切入点,通过分析论证,简化了现有的推测执行与事务存储模型中很多实际问题。首先分析了具有模糊依赖的任务特征及其潜在的可并行性,结合已有的加速模型,提出了目前线程级并行需解决的若干关键问题。其次提出了本文的解决方案SpFusion,对相关问题进行改进优化,在此基础上,给出了编译器自动并行的模板框架。在实验验证过程中,根据需要,提出了改进的高速缓存一致性协议Fusion,解决SpFusion模型易发生的cache(伪)共享竞争问题。最后,针对循环结构并行的测试结果表明,SpFusion推测模型对常规应用和有模糊依赖的应用都具有一定的性能加速比。
其他文献
隐私保护在现如今的各种数据应用中得到了越来越广泛的关注。这一现象源于两方面的原因:一方面,数据库和网络技术的迅猛发展,使人们能方便地发布和共享数据,这些数据中有可能包含
本文研究了基于多投影的结构光三维重建技术。利用多台投影仪与摄像机进行图像采集,并获取照射到被测物体在不同方位上的经过编码的结构光信息,对采集到的结构光图像进行解码
认知物联网赋予了物联网智慧特性,使网络能够通过自决策、自学习和自调节,提升物联网性能。同时,路由决策作为其关键技术之一,很大程度上决定了认知物联网的服务质量和通信性能。
针对运动想象脑机接口系统自适应能力不足,识别率低的问题,利用事件相关同步现象,即通过脑电采集装置采集相应的脑电信号,对其进行数据采集,预处理,特征提取和分类和模式识别等手段
随着商业信息量爆炸式的增长,电力企业的商业环境发生了巨大的变化。如何从大量信息中挖掘出有效的决策,成为企业亟需解决的问题。已经发展成熟的电力企业的财务管理系统同样
随着电子商务的迅猛发展以及业务需求的不断加深,企业内和企业间异构信息系统的通信和互操作越来越重要。通过引入SOA的体系结构,应用SOA的组件模型,将应用程序的不同功能单元通
科技的不断进步使得形形色色的移动机器人进入了人们的日常生活。面对日益激烈的市场竞争,提高移动机器人的开发效率、缩短开发周期是抢占市场的必由之路。本文通过调查研究,
近些年,电子商务作为一种新型的商务活动模式,受到了社会各界的广泛关注。然而随着电子商务市场的扩大,电子商务的信任危机不断显现出来,如:个人信息泄漏、网络欺诈、账户被
带球技术作为球员的基本个人技能之一,是RoboCup2D比赛研究的一个重点问题。球员带球动作设计的细致性和准确性以及带球路径选择的优劣直接影响整支球队比赛水平的高低。本文
随着计算机处理能力、数据库技术和互联网技术的发展,越来越多的信息被搜集起来以数字形式进行存储,运用数据挖掘技术能够有效地对这些数据进行分析和处理,从中发现有价值的