流体系结构关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:aierlansi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流体系结构是近年来出现的一种起源于媒体处理的高性能体系结构,一般采用大规模的运算阵列和多级存储,通过片内并行并结合面向媒体特征的指令,从体系结构角度实现对应用的高性能支持。与通用处理器体系结构相比,这种结构大幅度简化了指令控制和存储逻辑,设置大量的可编程运算功能单元且通信信道可编程,能够较好的解决现有通用处理器面临的计算压力,适应VLSI技术的发展。进一步研究表明,可编程流处理器在媒体应用、信息处理等一系列计算密集型应用上可获得与专用芯片相当的性能。但目前流体系结构还处于原型研究阶段,有许多关键技术值得探索和研究。在这样的背景下,作者选择了“流体系结构关键技术研究”的论文课题。本文对流体系结构进行了深入系统的研究,研究的内容涉及流处理特征、流程序设计模式、流水线的组织、核心级和流级硬件结构、特殊执行机制和系统构成等关键问题。在此基础上设计了MASA-I并实现基于流体系结构的SOPC系统。基于MASA-I流体系结构,本文从VLSI成本开销、多级存储层次容量和带宽、对流应用执行效率等几个方面对多个维度扩展的影响进行深入的分析和研究,并提出了全新的高性能扩展方案和具体设计——多维可扩展流体系结构MASA-II。由于流体系结构是一种对软件依赖度较高的结构,本文对新型流体系结构的软硬件系统融合技术进行研究,重点探讨了异构核的协同以及多个同构核之间协同机制,提出并实现了基于准动态调度的多核协同方案和片外存储空间的流数据共享方案,为高性能流处理器的进一步深入研究和实现工作奠定了坚实的基础。本文还研究了科学计算在流处理器MASA上的映射问题并分析其性能。最后,本文在流处理系统环境中较广泛和深入地研究了应用问题,将多类实际典型应用成功移植到流处理器上,包括信号处理、媒体应用、科学计算等领域的某些核心算法或是整个应用,分核心级和系统级详细评测MASA的性能,对多核流处理器进行了性能评估,这些实验结果为软件和硬件设计提供主要反馈。初步实验结果表明,流体系结构在以媒体、信号处理和科学计算为代表的密集计算领域具有极大潜能,研究还表明多维可扩展流体系结构扩展性好,能较好适应于更高性能、更广泛的流应用,并符合未来VLSI技术的发展趋势,是未来高效能计算中最有优势的体系结构之一。
其他文献
小组合作模式在高中数学教学实践中有着不可代替的优势,对于提高教学质量有着重要意义。本文通过分析小组合作模式在数学教学中的优势和意义,以及其中存在的问题,提出了几点
针对级进模难于实现自动化排样问题,利用VBA开发工具开发和设计了一套基于AutoCAD平台的级进模排样系统,该程序能够自动生成级进模各工位的冲切刃口和外形,实现级进模的自动
语言学习策略给学习者提供了一个使英语(外语)学习更加科学有效的工具。二十世纪七十年代至今,全球的语言学习策略研究已经在各个方面取得了巨大的进展。然而,中国的语言学习
作为中国最古老的一部手工业专著,《周礼·考工记》内容涉及到的一些宫廷乐器的制造制度和规范篇,即为有关编磬制造的专门记述,也是迄今各家研究中常常被论及的重要章节。由于专
风修正弹药布撒器(WCMD)是美军第四代制导航弹的重要组成力量之一,该武器通过将原战术弹药布撒器(TMD)的尾部组件替换为风修正弹药尾翼组件(WCMT)改装而成,利用该组件可实时
本试验选用东方百合系列的西伯利亚(Siberia)、索邦(Sorbonne)、元帅(Acapulco)、提伯(Diber)的鳞片,西伯利亚、马可波罗(Marco Polo)、元帅、卡莎布兰卡(Casa Blaca’)、黄时
本试验选用新中心、布鲁诺两个亚洲百合品种的鳞片,新中心的鳞茎内叶片为外植体进行培养,分别在无性培养系建立,胚性愈伤组织的增殖和分化,不定芽的增殖,生根结鳞茎和移栽五个阶段
随着分布式仿真规模的日益扩大,高性能并行计算技术的不断发展,并行与分布式仿真正逐渐成为新的研究热点。时间管理技术是决定并行与分布式仿真正确性和可重复性的关键技术,
<正> 一、旧中国的模具工业 解放前,我国工业基础薄弱,模具用得很少。少数模具大都是委托私人开业的模具作坊制作的。抗日战争时期,当时资源委员会下的国营机械、电工、仪器
在我国,煤层气勘探开发大多集中在中高煤阶含煤区,低煤阶含煤区的勘探开发研究在我国相对还很薄弱。由于低煤阶煤的物理、化学及孔隙结构与高煤阶有较大的差异,因此对低煤阶储层