基于FPGA的指令集架构神经网络协处理器的设计与验证

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：brettymate

【摘要】

：

针对大多数基于FPGA的加速器受限于运算资源与访存带宽,很难部署大型的神经网络这一问题,通过研究神经网络的计算特点,运用通用计算模型的思想,提出了一种指令集架构的神经网

【作者】

：

邓良陈章进乔栋屠程力

【机构】

：

上海大学微电子研究与开发中心,上海200444;上海大学微电子研究与开发中心,上海200444;上海大学计算中心,上海200444

【出处】

：

小型微型计算机系统

【发表日期】

：

2021年6期

【关键词】

：

协处理器神经网络加速指令集架构可编程逻辑器件

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对大多数基于FPGA的加速器受限于运算资源与访存带宽,很难部署大型的神经网络这一问题,通过研究神经网络的计算特点,运用通用计算模型的思想,提出了一种指令集架构的神经网络协处理器的设计方案.该方案中的协处理器具有一套专用的运算指令集,支持多种神经网络结构的运算,搭配相应的指令生成程序,能够灵活快速的进行神经网络在FPGA平台上的部署.考虑神经网络运算的相似性,对电路进行复用,降低资源的占用;设计内存多端口读写控制模块,通过协调片上缓存与片外存储,降低对访存带宽的需求.使用python与UVM验证方法学搭建验证平台进行验证,并在PYNQ-Z2开发板上进行实验.结果表明:方案中的协处理器对激活函数的运算误差在0.05以下,对其他类型指令的运算误差在10-4级别,工作在100MHz下的运算性能达到41.73GOPS,达到同类设计的主流水平,消耗的资源比同类设计平均降低80％.

其他文献

Enhanced aging and thermal shock performance of Mn1.95–xCo0.21Ni0.84SrxO4 NTC ceramics

The Mn1.95-xCo0.21Ni0.84SrxO4 (MCNS) (0 ≤ x ≤ 0.15) based negative temperature coefficient (NTC) materials are prepared by co-precipitation method. The replac

期刊

Sr-doped Mn–Co–Ni–O materialsnegative temperature coefficient (NTC) ceramicsel

Electrical transport in lead-free Na0.5Bi0.5TiO3 ceramics

Lead-free Na0.5Bi0.5TiO3 (NBT) ceramics were prepared via a conventional oxide-mixed sintering route and their electrical transport properties were investigated

期刊

Na0.5Bi0.5TiO3 (NBT) ceramicselectrical propertiesSeebeck coefficientimpedanc

一种特征值区间划分的模型决策树加速算法

目前对决策树(Decision Tree,DT)分类问题的相关研究已取得了很多成果,但仍存在一些问题,如决策树在寻找最优切分点时需要遍历特征的所有取值,当数据集规模较大时,递归构建决

期刊

决策树基尼指数模型决策树等精度特征值区间划分变精度特征值区间划分

融合上下文信息的个性化序列推荐深度学习模型

针对现实购物场景中存在的用户偏好多样性且兴趣动态变化的问题,本文提出一种融合上下文信息的序列推荐模型(DeepSeq),通过嵌入用户提供的反馈信息深入挖掘用户的长短期潜在

期刊

特征序列上下文信息长短期会话深度学习注意力机制

基于FPGA的指令集架构神经网络协处理器的设计与验证

其他学术论文