论文部分内容阅读
在多路径最短路由NoC中,需要重组缓存区来确保数据包的顺序传输。然而,在硬件设计中,传统估算法缺乏最差情形的分析,所设计的重组缓存区的面积通常比较大,导致不必要的面积开销。本文基于网络演算,以多路径最短路由NoC中重组缓存为研究对象,研究最差情形性能下重组缓存的分析模型和优化方法,最终完成硬件实现。主要工作如下:(1)多路径最短路由NoC重组缓存上界的分析针对传统经验法中缺乏最差情形分析导致不必要的面积开销等问题,提出一种多路径最短路由NoC重组缓存上界的分析模型。基于网络演算理论,建立多路径路由NoC等效服务曲线的分析模型,推导出各条子流的延迟上界;进而建立位于路径末端重组缓存的分析模型,推导出重组缓存上界;同时通过仿真模型和工业例子进行了实验分析及验证。结果表明与最差路径相比,最优路径对应的重组缓存减少了42个微片,最大改善了95.64%。对两种映射的工业例子进行研究,结果表明与映射1相比,映射2的重组缓存减少了76个微片,最大优化了36.50%,这很大的节省了硬件设计中重组缓存资源的成本。(2)多路径最短路由NoC重组缓存上界的优化针对全遍历方法求解重组缓存上界耗时且效率低等问题,提出一种多路径最短路由NoC重组缓存上界的优化方法。首先通过挑选过程和预测过程来实现优化机制,并且以二维4×4网络为例对优化过程进行详细阐述;其次通过实验分析得到随着冲突流的增多,冲突系数可以更好的表征重组缓存上界;随着网络规模的增大,优化效果更明显,对于6×6网络,相比于全遍历方法,冲突预测优化方法计算效率提高了52倍,运行时间缩短了269分钟。(3)多路径最短路由NoC重组缓存区的硬件实现为了验证分析结果的正确性,设计重组缓存区的硬件模型,并对重组缓存区的面积和功耗进行评估。首先给出通过查找表实现的重组缓存区的硬件模型,然后给出了整体的测试机制,包括流量发生器,路由节点互联而成的网络以及重组缓存模块。最后通过实验得出分析与仿真结果的对比,验证了分析结果的正确性,同时分析了趋势不一致的原因;采用TSMC的65nm工艺库,Synopsys公司的DC工具进行逻辑综合,最终结果表明,在不同目标流拆分比下,重组缓存区面积最大优化了34.1%,功耗最大优化了34.41%。