基于强化学习的Web应用云资源动态供应方法

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:cugll2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
越来越多的企业将Web应用部署到从公有云提供商动态租赁的虚拟机集群上。Web应用的负载随时间动态变化,因此需要根据负载变化动态租赁或释放合适数量的虚拟机,云计算虚拟机按需租赁的特点能够较好地满足虚拟机动态租赁的需求。本文针对Web应用的单一层设计云资源动态供应方法,目标是在满足服务等级协议的前提下,动态调整异构虚拟机租赁方案,最小化资源租赁成本。已有研究广泛使用基于确定模型的排队论和控制理论的方法,但是Web系统的请求到达率、资源总能力和请求响应时间之间的关系具有复杂非线性特征,增加了建立确定模型的难度。已有模型与实际系统之间依然存在较大偏差,限制了这些方法的性能。本文考虑云计算虚拟机具有不同计费方式的特点,提出了基于深度Q网络、近端策略优化的Web应用异构资源弹性租赁方法。深度Q网络和近端策略优化属于不同类型的强化学习方法。强化学习是一种以试错的方式进行学习的机器学习算法,通过智能体与环境的交互学习最佳策略。基于强化学习的方法能够对Web系统的非线性性能特征进行准确建模。而且强化学习对系统先验知识的要求较少,针对特定Web系统设计的强化学习方法能够灵活移植到不同的Web系统。本文研究工作包括:(1)针对Web应用选择合适的系统性能指标作为强化学习状态表示参数。探究了不同状态参数组合和不同状态空间维度对算法效果的影响。(2)针对异构虚拟机租赁场景,在考虑算法收敛速度的前提下,提出了一种基于增量总能力的动作定义方法。探究了不同动作空间大小对不同负载的应对能力。(3)在基于增量总能力的动作空间定义的基础上,针对异构竞价型虚拟机租赁场景,使用整数线性规划(ILP)分别针对资源扩张和收缩场景建模,寻找成本最低的虚拟机租赁组合方案,实现从强化学习指导动作到异构虚拟机租赁方案的映射。(4)提出了综合考虑平均请求响应延迟、虚拟机租赁成本、成功请求数、失败请求数的奖励函数设计,并在后续实验中使用该奖励函数评估算法性能。(5)使用近端策略优化算法设计Web应用异构云资源动态供应方法,整合了基于值和基于动作概率两类不同强化学习策略的优点。与深度Q网络相比,提升了算法在无指导情况下的早期性能。(6)基于云计算仿真平台Cloud Sim,研发了支持强化学习算法的Web应用仿真平台RL-Cloud Sim,并利用该平台对算法性能进行测试。本文提出的基于增量总能力的方法获得的平均奖励回报相比基于虚拟机总数量的方法和每次只能调整一台单一类型虚拟机的方法,分别提升了50.86%和36.13%。在同样无外部算法指导的情况下,本文提出的基于近端策略优化方法的效果远优于基于深度Q网络的方法。无指导近端策略优化能够较早地取得和有指导深度Q网络相似的效果,避免针对特定Web系统建立复杂的指导算法。
其他文献
随着互联网和计算机应用技术的飞速发展,网络用户规模呈现爆炸式增长,网络在提供包括但不限于应用办公、信息通讯、信息存储等广泛应用的同时,大量网络用户数据也极易遭受来自外部或内部的入侵攻击。近年来,网络安全事件层出不穷,攻击方式不断升级,因此研究有效的网络流量异常检测方法对于构建网络安全态势,及维护网络空间安全均体现出重要意义。当前,异常流量识别方法大都需要人工手动逐一提取流量特征,相对分散的流量特征
加压训练起源于日本,这种训练方法凭借其安全性和高效性得到了广泛的传播使用,如今加压训练已经广泛应用于竞技体育训练、老年人医疗和运动康复等领域,但对青少年学生的研究较少。本文希望通过探讨低强度(30%1RM)加压训练与中等强度(50%1RM)加压训练对高中生体质健康(身体素质指标、身体形态指标)的影响效果,并与传统不加压训练进行对比。探讨加压训练对高中生体质健康训练的有效性,为高中生体质健康训练提供
身份研究一直是人文社科,尤其是社会心理学的重点。随着学术思潮经历了由本质主义到建构主义的转变,身份的特点也逐渐从静止不变的状态发展成具有动态和易变的本质特征。身份构建的问题也不断地被语用学家所提及。如今,网络作为一个虚拟的公众空间,交际者可以根据需要构建最有利于自己的身份,以不受现实交际的限制。如何在网络的背景下构建特定的语用身份成为了值得讨论的话题。电商直播行业是目前最热门的线上网络购物模式,主
波动率在金融领域有着十分广泛的运用,例如投资组合的构建、在险价值VaR的计算、对资产进行定价等等。对波动率的预测有许许多多的模型,但总的来说,对未来波动率的预测方式可以分为两类:一类是直接根据已有历史数据进行未来波动率的预测,即为历史波动率;另一类则是根据标的金融资产期权的价格来倒推出未来波动率,因为期权反应了市场对于未来的预期,这样提取出来的波动率称为隐含波动率,主要有BS隐含波动率和无模型隐含
城乡社区是社会治理的基本单元,街道办事处及社区居民委员是重要的治理主体,为贯彻落实党和国家政策方针、维护基层社会稳定、提高居民生活幸福感贡献了重要力量。社区工作者的服务理念和服务能力直接关系着居民对国家治理结果的直观感受,因此,对基层政权而言,拥有一支职业化的社区工作者队伍,使其用专业化、社会化的方式为居民提供优质的公共服务意义重大。本文将增能理论与自我效能感结合作为理论分析框架,采用多种研究方法
自改革开放以来,我国的宏观经济发生了飞跃式增长,GDP总量仅次于美国,成为世界第二大经济体,2020年末中国经济规模首次突破100万亿大关。宏观经济的快速发展、居民财富的急剧增长,极大地刺激和推动了我国资管行业的蓬勃发展,特别是证券投资基金行业,呈现急速扩张的趋势。近十年,我国基金公司、基金和基金投资者的规模和数量经历了飞速增长,截至2020年末,我国共批设有143家基金管理公司和7403只基金,
近年来,股权质押由于审批手续较简便、融资成本较低等优势备受上市公司大股东等融资业务的青睐。据中证登统计,截至2021年3月5日,A股股权质押总比例为6.69%,质押市值达4.23万亿。本文不同于普遍的实证研究,以案例为切入点回顾中珠医疗质押始末,探寻其质押动机,通过分析推断和事实证据描述控股股东获取控制权私利的路径,并对公司长短期市场反应来研究获取私利行为对公司的价值影响,为后续研究提供了相应的经
2019年12月底爆发的新冠肺炎被世界卫生组织定义为一次全球性的公共卫生危机。中国作为最先公开报道新冠病毒的国家迅速的采取了各项防控措施并取得了显著的成果,而美国国内的疫情形势却始终未得到有效控制。在过去的一年中,中美两国主流媒体关于新冠肺炎的报道成为了一个冲突焦点。因此,本文试图就中美主流媒体关于新冠肺炎的报道进行对比分析,从而揭示新闻话语背后的意识形态与权力关系。鉴于此,本文采用了费尔克劳夫的
在加紧建设自由贸易区的战略背景下,中国自由贸易协定得到了一定的发展。消费者保护作为“WTO-X”型议题和“二十一世纪经贸议题”,在我国对外签订自贸协定的过程中越来越得到重视。目前,我国自贸协定消费者保护条款正处于发展阶段。通过对部分他国自贸协定消费者保护条款的借鉴,对该条款在我国的发展有一定的积极作用。本文通过分析我国消费者保护条款的现状,以及他国自贸协定中该条款的制定情况,具体探讨CPTPP、A
在产业升级、技术革新的环境背景下,并购活动越来越频繁地出现在我国资本市场上,并购基金作为并购市场中的重要工具经历了高速发展之后在“新资管”的严格条件下进入到调整升级阶段。其中,上市公司与PE合作设立并购基金融合了金融资本和产业资本,有助于帮助上市公司通过并购实现战略布局,提升企业价值;同时,提前锁定退出机制减少了PE机构的投资风险。因此,“上市公司+PE”型并购基金受到资本的热捧。然而,由于“上市