论文部分内容阅读
流体系结构是近年来出现的一种起源于媒体处理的高性能体系结构,一般采用大规模的运算阵列和多级存储,通过片内并行并结合面向媒体特征的指令,从体系结构角度实现对应用的高性能支持。与通用处理器体系结构相比,这种结构大幅度简化了指令控制和存储逻辑,设置大量的可编程运算功能单元且通信信道可编程,能够较好的解决现有通用处理器面临的计算压力,适应VLSI技术的发展。进一步研究表明,可编程流处理器在媒体应用、信息处理等一系列计算密集型应用上可获得与专用芯片相当的性能。但目前流体系结构还处于原型研究阶段,有许多关键技术值得探索和研究。在这样的背景下,作者选择了“流体系结构关键技术研究”的论文课题。本文对流体系结构进行了深入系统的研究,研究的内容涉及流处理特征、流程序设计模式、流水线的组织、核心级和流级硬件结构、特殊执行机制和系统构成等关键问题。在此基础上设计了MASA-I并实现基于流体系结构的SOPC系统。基于MASA-I流体系结构,本文从VLSI成本开销、多级存储层次容量和带宽、对流应用执行效率等几个方面对多个维度扩展的影响进行深入的分析和研究,并提出了全新的高性能扩展方案和具体设计——多维可扩展流体系结构MASA-II。由于流体系结构是一种对软件依赖度较高的结构,本文对新型流体系结构的软硬件系统融合技术进行研究,重点探讨了异构核的协同以及多个同构核之间协同机制,提出并实现了基于准动态调度的多核协同方案和片外存储空间的流数据共享方案,为高性能流处理器的进一步深入研究和实现工作奠定了坚实的基础。本文还研究了科学计算在流处理器MASA上的映射问题并分析其性能。最后,本文在流处理系统环境中较广泛和深入地研究了应用问题,将多类实际典型应用成功移植到流处理器上,包括信号处理、媒体应用、科学计算等领域的某些核心算法或是整个应用,分核心级和系统级详细评测MASA的性能,对多核流处理器进行了性能评估,这些实验结果为软件和硬件设计提供主要反馈。初步实验结果表明,流体系结构在以媒体、信号处理和科学计算为代表的密集计算领域具有极大潜能,研究还表明多维可扩展流体系结构扩展性好,能较好适应于更高性能、更广泛的流应用,并符合未来VLSI技术的发展趋势,是未来高效能计算中最有优势的体系结构之一。