面向深度神经网络的模型压缩与加速研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:bbq2004_83
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着卷积神经网络的发展,网络的层数不断增加,参数量与计算量成倍增长,对硬件的存储资源和计算资源要求越来越高,也对神经网络在工业界嵌入式设备、移动端设备和其他资源受限的平台上部署应用带来了诸多困难。因而催生了模型压缩算法,对现有网络的参数进行压缩,从而减少运算次数,提高推理速度。但是目前的模型压缩算法发展还存在着严重破坏网络原有精度、压缩倍数不理想、可选择压缩方式单一等缺陷,针对这些问题,本论文提出了基于注意力机制的网络剪枝算法和知识蒸馏算法,可在压缩模型的同时保持原有的高精度,进一步与网络量化算法结合构成了一个完整的模型压缩框架,在图像分类和目标检测任务上验证了该框架的压缩效果。本文主要的工作与创新点如下:1.提出了一个基于辅助注意力编码层的网络通道剪枝算法。将通道域注意力信息与剪枝的二值化掩码相结合,设计成为一种可嵌入网络的编码层,通过专门设计的直通估计器估计离散值的梯度,与原始网络一起通过反向传播算法更新训练,得到一个稀疏的网络。无需额外的微调训练,即可方便地剔除冗余参数。在不同规模的数据集和不同网络结构上验证了剪枝算法的有效性。2.提出了 一个基于双域注意力的衰减知识蒸馏算法。在原始知识蒸馏算法的基础上,将空间域注意力信息和网络输出概率编码形成目标概率,经过一个选择性蒸馏模块对学生网络进行指导训练。接着使用均方差损失拉近师生网络对之间的通道域注意力向量的距离,使用衰减策略对蒸馏损失进行权重退火,逐渐提升学生网络的独立学习能力。然后在不同结构网络和数据集上对比验证本算法的有效性和创新性。3.提出了一个通用的自动化模型压缩与加速框架。它包括前述的剪枝、蒸馏算法和8位网络量化算法。该框架可以根据不同的用户需求和应用场景选择合适的压缩策略。同时,对剪枝和蒸馏模块增加了强化学习策略,可以简化调参流程,降低使用门槛,形成自动化剪枝模块和自动化蒸馏模块。最后在不同的视觉任务上验证了本框架的压缩效果和泛化能力。
其他文献
学位
学位
学位
“三禮”經典,本非一時一地之作,在具體器物層面也頗有語焉不詳之處,如何詮釋“三禮”文本以資時用,歷代學者各有其思考。然借助今日的民俗學儀式學成果,傳統喪禮的儀式中,安頓死者形與神的兩條脈絡清晰可見。而通過此脈絡的梳理,對於喪禮出喪所用之車器,在傳統禮學聚訟的一些問題上可以做出新的詮釋,以期豐富今日接續傳統和重建新儀的思路。出喪時安頓主體所用的車器便有柩車和魂車兩種。本文的第一章考察運載屍體的柩車及
乾隆时期是清代宗室诗人的鼎盛时期,也是由盛转衰的关键转折期。宗室诗人爱新觉罗·弘晓是清代宗室诗人中的佼佼者,更是盛衰转折的重要见证人。本文以弘晓为研究对象,通过家世生平、交游网络、诗歌题材和艺术特色、盛世隐逸四个方面的研究,力图展现出弘晓的整体风貌,以及乾隆时期宗室诗人由盛转衰的关键原因。以下,对各章的主要内容做简略介绍。第一章考察宗室诗人弘晓的家世生平。弘晓是一个缺乏政治才干,逐渐被边缘化,深刻
五四时期由《新青年》与《东方杂志》发端围绕东西文化问题展开讨论,进而在中国学界引发了一场长达十余年的学术论战。这场论战不仅是前半个世纪关于文化问题各种论争的逻辑延伸,也是清末民初新旧杂糅的时局以及各种思潮相互激荡与激烈斗争的产物。《新青年》与这场东西文化问题论战关系密切。一开始《新青年》就是这场论战的主要阵地,《新青年》同人作为论战的重要一方,围绕着东西文化问题进行了非常充分的阐释,主要体现在三个
何基、王柏、金履祥、许谦是宋元时期金华地区的四位学者,史称“北山四先生”。北山四先生继黄榦之学,以“熟读《四书》”为治学之重心,终生奉守朱子学,被后世推崇为“理学正宗”。北山四先生将诠释“经典”作为传承朱子学的主要手段,以“四书”为核心,扩展至“五经”、“四部”之研究,使经典诠释从文献疏解与历史考证两条路径之上得到推进,重新唤醒程朱理学的内在生命力。本文主要从四个方面系统梳理了以《大学》为中心的北
在深化教育改革背景下,教育部门提出了要解决学生学习困难的工作理念,高中阶段更是成为教育部门重点关注的对象。经过调研,大部分高中学生对物理课程存在较为明显的学习困难,85%的学生均表示自己对物理课程学习存在一定问题。鉴于此,笔者对高中物理教学中存在的问题进行了分析,并结合学生实际情况提出了适应难度、建立自信,强化信念、培养品质,注意方式、学会学习,改革创新、优化教学模式,重视学生、培养学习兴趣五个解
果品产业经济是我国农业经济的重要组成部分之一,果园害虫威胁着果实的总体产量和整体品质,影响果品产业的发展速度和发展质量。因此,在果品种植过程中,准确高效地实现果园害虫的检测对于果园害虫治理和提升果品产业经济效益至关重要。果园害虫的传统检测方法大多依赖于人工方式和传统计算机视觉手段,存在检测效率低、主观性强、可推广性差、检测周期长等缺点,不能满足智能化果园害虫实时检测需要。为了实现更为高效智能的果园
鉴于多媒体内容易修改、复制和二次传播等特点,多媒体版权保护与监管问题是多媒体内容分化流程的重中之重。作为多媒体内容分发系统的关键环节之一,数字版权管理系统确保多媒体内容仅由已授权用户安全地使用。我国的数字版权管理系统逻辑架构在不断完善,对系统在容灾迁移、弹性伸缩和业务扩展性等方面均提出了新的业务需求,在这些方面,传统单一主机的系统部署方式存在着劣势。而随着应用容器化和业务系统云端部署趋势的出现,基