基于迁移强化学习的无线接入网能耗优化研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:stefanie456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在未来的5G网络中,预计将使用云无线接入网(C-RAN)来支持海量终端。为了满足所有终端的需求,需要在单位面积内部署更多的射频拉远头(RRH)。从经济角度来看,最大限度地减少RRH的能量消耗是个很有挑战的问题。从环境的角度来看,在无线网络中实现“绿色”也是运营商的众多目标之一。首先,对于大部分现有的基于深度强化学习(DRL)的能耗优化方法,在定义环境状态时通常都忽略了RRH与用户终端设备(UE)之间的关联关系,导致UE需要向RRH上报自身的信息,这带来了额外的信令开销,并且对于移动性场景由于无法捕捉UE的移动导致无法及时更新决策,这也限制了节能效果。其次,基于强化学习的方法通常需要定义reward,当场景发生变化时,reward的参数需要手工重新调整,这导致算法在自动化和灵活性方面还存在不足。除此之外,基于强化学习的能耗优化算法直接将能耗问题建模成一个马尔科夫决策过程来实现端到端的输出,但是在陌生的场景中泛化能力不足,如果在新场景中重新训练的话,时间开销又很大。因此,本文致力于研究一个可以根据流量情况动态的激活或去激活小区的能耗优化系统,旨在保证UE的QoS满意度的前提下,最小化整个系统的能量消耗。首先,本文提出了两种基于DRL和卷积神经网络(CNN)的小区自动激活策略,分别是基于relational DQN的小区自动激活策略与基于relational dueling DQN的小区自动激活策略。其中,relational DQN是DQN的改进算法,relational dueling DQN是dueling DQN的改进算法。通过以RRH与UE之间的原始关系矩阵作为输入,并利用CNN做特征提取,最后将提取的特征输入给智能体(Agent),从而实现小区的自动激活。其次,本文进一步对方案进行扩展,先提出了一种动态的reward,它可以在学习过程中自动的调整reward的参数,从而平衡系统的能耗和UE的QoS满意度。然后,在方案中更进一步的引入迁移学习。经过实验测试,本文所提基于CNN和DRL的方案在平衡UE的QoS满意度和系统能耗方面具有更好的性能。同时,本文提出的动态reward在学习过程中,可以根据当前系统能耗与UE的QoS满意度情况动态的调整reward参数,从而使系统能耗与UE的QoS满意度得到平衡;最后,通过在DRL中引入迁移思想的小区自动激活方案相比于在新场景重新训练,节省了大量的训练时间。
其他文献
1998年,我国房地产行业进入市场化阶段。房地产行业的高速发展带动了整体经济的增长,但房价的过快增长也成为了社会热点问题。从2014年1月到2016年9月,深圳的房价涨幅高达80%,上海房价涨幅高达40%,北京和广州也分别达到32%和24%。“十三五”规划提出房价调控政策应更加重视房价的区域联动性和核心城市的溢出效应。同时,城市间的房价联动性会减弱住房抵押贷款证券化(以下简称MBS)等产品分散风险
本文通过对新世纪中国工业题材纪录片进行分析,探讨:为什么工业题材纪录片在近几年得以蓬勃发展;与中国目前所处的时代有何种联系;内容主体是如何体现故事性;创作者是如何使
卢木斋是天津近代著名教育家、藏书家和实业家,他的教育思想内容丰富,具有爱国性、普及性、系统性、时代性的特点,对当时教育近代化的发展产生了巨大影响;他的教育实践活动范围广泛,在学校教育、图书馆事业和古籍善本收藏及刊印方面都做出了伟大的贡献。研究卢木斋的教育思想,有助于填补教育史学科在此方面的空白,为指导地方教育的改革和发展、落实新时代爱国主义教育提供些许启示。采用文献法和历史研究法。主要内容共有四章
本翻译实践报告以罗娜·多美古·哈鲁拉尼所著的《批判性视角下的跨文化传播》一书第五章的翻译为研究对象。如其书名所著,这是一部从批判性视角来重新审视并研究跨文化传播
国家教育部颁布了《中国学生发展核心素养》,从教育意义上看,对于课堂所要达到的教学目标不再局限于课堂教学的知识、方法与能力,更多地需要我们关注文化基础、自主发展、社
在全球化背景下,英语早已成为工作和交流的重要手段。越来越多的工作岗位和就业机会要求人们具备熟练使用英语的能力。教育部公布的《大学英语教学指南》(2017)特别指出:“大
随着移动终端数量和无线流量业务的不断增加,移动用户对无线业务流量的需求呈现爆炸式的增长。如何应对上述激增的无线业务流量和高质量的用户服务质量需求,是目前无线通信技术急需解决的关键问题。异构蜂窝网络通过在传统蜂窝网络中部署多种不同类型的基站,能够有效地提高传统蜂窝网络的覆盖范围和通信容量,成为通信领域研究的热点。然而,在异构蜂窝网络中,无线流量需求的时变性和用户位置分布的随机性等特点,导致无线流量预
<正>教育家孔丘曾说:"不愤不启,不悱不发。"我国自古就有着启发式教学的教学模式。随着新课改的不断深入,教师不但要传承启发式教学这一数学文化,更要大力弘扬、倡导启发式教
我国粮食主产区在生产方式上普遍存在着高耗低效的问题,充分利用土壤水肥,显著提高作物产量,是农田管理者长期的追求目标。水肥过量施用与土壤优先流现象均会造成水肥利用效率低、地下水污染等问题。因此,在粮食生产中如何实现作物高产、水肥高效利用是一项不断在探索的工作。本试验主要分为夏玉米小区试验和优先流染色示踪试验两部分:小区试验在山东省灌溉试验中心站开展,通过设置灌溉2个水平I1(67.5 mm)和I2(