基于FPGA的深度卷积神经网络优化实现方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ADCADC111111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习逐渐在各个领域中发挥出重要作用,而深度卷积神经网络(Deep Conv olution Neural Network,DCNN)是深度学习中的关键技术。DCNN以多层级卷积层为核心,构成可以提取图像特征的神经网络,于目标检测、目标分类、语义分割等领域都被广泛应用。随着硬件算力的发展,复杂的神经网络结构也逐渐可以实现于各种设备中,于是精度逐渐成为神经网络的最重要性能指标。因此以精度高为主要优势的DCNN备受研究者青睐。但是,由于DCNN的网络模型尺寸较大并且计算量和参数量较多,高效实现DCN N还存在许多困难。比如,DCNN的网络结构过于复杂时,训练的过程中容易出现过拟合问题,使DCNN的精度难以达到需求。另外,实现在硬件中的DCNN所占用的运算资源和存储空间庞大,难以应用于处理速度较快、运行设备规模较小的场景中。为了解决上述技术难点,本文从网络结构优化和硬件实现优化两个角度出发,对现有的DCNN实现方法进行了学习、总结以及改进,提出了几种新的DCNN实现优化方法。并且采用网络结构优化方法,搭建、训练并测试了一个轻量级DCNN——Agile Net;采用硬件实现优化方法,在现场可编程门阵列(Field Programmable Gate Arrays,FPGA)中实现了基于Agile Net的分类器,并测试其正确性和重要参数。最终对软硬件的测试结果分别进行了分析,验证了所提出DCNN实现优化方法的有效性。本文的主要工作和贡献如下:1)针对DCNN的各个组成部分进行了优化设计方法研究,搭建并训练了轻量级DCNN网络—Agile Net。该网络精度与经典网络Inception-v3相比精度相近但网络模型规模更小,网络结构更加合理。2)使用C++语言,在Vivado HLS中应用流水线、并行化等硬件优化技术,完成了Agile Net图像分类器的FPGA硬件实现。测试表明该分类器在资源使用率和处理速度方面优于GPU和CPU的实现方式。
其他文献
本文总结了过去天象仪上所用各种分划板的加工工艺的主要缺点,提出了新的加工方法。并对加工设备进行了改进,除采用微机控制外,对模板的定位装置、制板镜头的选择、光源滤色
目前国内核电厂循环水系统使用的真空破坏阀多为先导式电控气动隔膜阀(以下简称先导式真空破坏阀)。先导式真空破坏阀与循环水泵联控,通过逻辑信号以控制阀门启闭。水力自动
嘧啶硫醚类化合物具有良好的生物活性,在医药、农药等领域都有广泛的应用。本文以4,6-二甲基嘧啶-2-硫醇为先导化合物,通过活性亚结构拼接的方法,将嘧啶硫醚结构分别与1,3,4-
目的:比较分析新冠肺炎爆发中国和菲律宾民众的认知水平和心理状态,为开发个性化护理策略提供依据。方法:通过发布调查问卷收集资料并进行描述性统计和t检验分析。结果:中国
通过连续3年对引进栽植的金花忍冬(Lonicera chrysantha Turcz.)的物候及抗性的观测记录说明,其抗病虫危害、抗寒性、耐热性和耐盐碱性强,适宜在引种地进行绿化种植。种子繁
共和国七十年长篇小说的发展大致经历了四次集中爆发,即1957-1960年红色经典繁盛期、1979-1982年历史意识觉醒期、1993-1996年多元格局形成期和2009-2013年的本土意识回归期,
输气站场排污系统是站场必备功能系统之一,主要由排污管、排污阀以及排污池、排污罐组成,担负着站内排污收集、储存、外运等任务,对保持站场功能完整性起着重要作用。然而,作
目的通过CT单能量联合多伪影去除(multi-artifact reduction, MAR)技术的综合应用,以期有效去除颅内动脉瘤弹簧圈栓塞术后金属伪影并同时优化血管显示。方法收集本院2019年1-
小学作为培养人才的摇篮,具有不可替代的重要性。我国自古就重视教育,尤其是我国的小学教育水平更是在国际上享誉盛名。通过近些年来我国经济不断发展,小学教育也得到了长足