【摘 要】
:
近年来,深度学习得到了许多学者的广泛关注与研究,并在诸多领域取得了巨大的成功。随着对深度学习技术的深入研究,深度学习模型的规模逐渐增大,同时,网络中的数据量呈指数增长,为深度学习模型提供了大量的训练数据。然而,利用庞大的数据集对大规模的深度学习模型进行训练,需要消耗大量的计算资源和训练时间。随着网络技术和分布式优化理论的发展,很多集中式算法难以解决的大规模优化问题可以通过多台计算机相互协作共同完成
论文部分内容阅读
近年来,深度学习得到了许多学者的广泛关注与研究,并在诸多领域取得了巨大的成功。随着对深度学习技术的深入研究,深度学习模型的规模逐渐增大,同时,网络中的数据量呈指数增长,为深度学习模型提供了大量的训练数据。然而,利用庞大的数据集对大规模的深度学习模型进行训练,需要消耗大量的计算资源和训练时间。随着网络技术和分布式优化理论的发展,很多集中式算法难以解决的大规模优化问题可以通过多台计算机相互协作共同完成。因此,深度学习模型的训练可以转化成分布式优化问题来解决。为了减少计算资源的消耗和训练时间,如何设计高效的分布式优化算法对深度学习的发展至关重要。为高效处理约束优化问题并减少计算资源的消耗,本文主要围绕深度学习的分布式在线优化算法展开研究。基于条件梯度(Frank-Wolfe)技术,分别提出两种新颖的分布式在线无投影优化算法:基于随机块坐标的分布式在线无投影优化算法和基于事件驱动的分布式在线无投影优化算法。主要研究内容如下。针对基于条件梯度的分布式在线无投影算法在处理高维数据时计算量过大的问题,本文将随机块坐标算法和Frank-Wolfe技术相结合,提出了一种基于随机块坐标的分布式在线无投影算法。该算法在每次迭代过程中只需要从(次)梯度向量的分量中随机地选择它们的子集进行更新,能够减少每次迭代过程中的计算量。通过详细的理论分析,证明了所提算法的收敛性,且当局部目标函数是凸函数时,算法的后悔上界为O(T~1/2)。仿真实验验证了所提算法在不同的网络拓扑下的收敛性以及不同节点个数的收敛性。针对基于条件梯度的分布式在线无投影算法因频繁通信导致通信开销过大,本文提出了一种基于事件驱动的分布式在线无投影算法。在该算法中,网络中每个计算设备的当前状态与最后一次驱动状态之间的离差存在一个阈值,只有当离差大于该阈值时设备之间才进行通信,否则不通信。通过有效控制设备之间的通信次数,减少通信开销。采用严格的数学推导证明了算法的收敛性,当局部目标函数是凸函数时,算法能达到O(T~1/2)的后悔上界。本文针对现有的分布式在线优化算法计算量大和通讯开销大的问题,分别提出了基于随机块坐标的分布式在线无投影算法和基于事件驱动的分布式在线无投影算法,相关成果对分布式在线无投影算法的优化研究具有重要的参考价值。
其他文献
本研究以小麦-玉米常规施肥模式T2:100%氮肥+0%菜粕,为对照,设置6种肥料管理模式,配施肥比例为施氮量比例,即T1:空白(不施肥),T2:100%化学氮肥+0%菜粕,T3:0%化学氮肥+100%菜
水稻根系有着吸收水分、矿物质及固持植物体的重要功能,另外根系还有繁殖、合成生长调节剂和贮存合成有机物质的作用。本研究以RM109/密阳23的F4代含有2840个家系的重组自交
近年来,随着互联网持续高速发展,生活节奏变得越来越快,人们往往没有时间和耐心去看冗长的文章,各种社交媒介也迅速普及,微博作为新兴的社交媒体平台之一,因其可以随时随地发表自己对于事件的观点、看法,抒发自己的感情,实时的发布和获取信息,并且还可以通过转发,点赞的方式分享信息,不受时间和地点的限制而被广泛使用。微博中蕴含着大量的信息,是舆情的重要来源,有效的对微博数据进行获取和分析,得到热点话题,并做话
依托华润电力曹妃甸电厂二期2×1 000 MW超超临界燃煤发电机组基础工程,运用有限元软件ANSYS建立基础实体模型。本文通过几个方面进行了系统研究:结构优化时改变低压缸横梁高
随着乘用车的普及率越来越高,螺纹连接这种乘用车上最常见的连接方式发生故障的事件也屡见不鲜,螺纹连接点夹紧力的设计及控制则会直接影响其安全性和可靠性。目前多数汽车生产商在螺纹连接点设计上采取的是沿用已有的类似设计的方法,再通过整车耐久测试加以验证。这种方式不仅效率较低,而且开发成本较高。论文在此背景下,结合常见的客户抱怨及汽车主机厂的现场生产实际,从螺纹接头夹紧力需求的分析出发,采用VDI 2230
悬索桥索塔横梁施工是上构施工过程中重要的工作内容,是操作难度大、风险性高、工期较长的分项工程,利用预制装配化施工的概念,改进索塔横梁施工方法,缩短施工工期和减低高空作业风险,是一项较好的创新工作,对其展开的研究具有较好的工程使用价值。本文依托实际工程,针对悬索桥索塔中横梁预制段整体提升的方案可行性,以及其重要设备能力进行了具体分析研究。主要研究内容与结论如下:(1)合理利用LSD液压提升系统、工字
本文以北朝文学为立足点,将其文学进程分为三个阶段,分别从北朝、南朝、初唐三个方面去考察这三个阶段,力图挖掘出人们对北朝文学完整的动态的认识。第一个阶段是从五胡十六国至北魏孝文帝改革之前,北朝人对此时的文学接受主要集中在文教事业上。南朝人对这一时期的文学接受主要集中在前凉,此时南北有了文化往来,前凉的文学作品得以在南方流传,并得到了南方文人的认可。到了初唐,此时人们也同样认为这一阶段的文学主要是表现
自1985年中国银行发行第一张信用卡以来,我国信用卡已经历了萌芽、探索、萎靡和成长期,至今35年的发展历程。随着中国社会的进步,各项金融政策的出台,互联网的普及,移动支付快速扩张,网上借贷工具层出不穷,这些都使得实体银行零售业务面临着巨大的挑战。整体来看信用卡盈利能力强,信用卡业务成为近几年商业银行主推的业务之一,各家银行不断规划与改进其信用卡营销策略,为了最大限度争取信用卡客户资源。由于消费需求
声纹识别是一种根据说话人语音来辨别说话人身份的技术,属于生物认证方式的一种。随着深度学习技术在声纹识别技术中的应用,无论是在注册语音时长还是识别准确率上,声纹识别技术的性能都实现了新的突破。当前声纹识别技术面临的挑战主要包括短语音能力、抗噪声能力、跨信道差异能力、抗假冒攻击能力以及抗时变能力。本文主要研究方向是如何在更短的说话人语音中提取出更多的能够表征说话人身份的有效信息。基于上述问题,本文开展
目的:探讨平均血小板体积(Mean platelet volume,MPV)和血小板/淋巴细胞比值(Platelet/lymphocyte ratio,PLR)在预测急性一氧化碳中毒迟发性脑病发生中的应用价值。方法:纳入2015年1月1日至2018年12月31日川北医学院附属医院急诊科与神经内科住院的年龄在18-65岁之间的确诊为急性一氧化碳中毒和迟发性脑病的病人102例,根据严重程度分为:轻度组