进化强化学习及其在机器人路径跟踪中的应用

来源 :控制与决策 | 被引量 : 0次 | 上传用户:xby520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了一种基于自适应启发评价(AHC)强化学习的移动机器人路径跟踪控制方法.AHC的评价单元(ACE)采用多层前向神经网络来实现,将TD(λ)算法和梯度下降法相结合来更新神经网络的权值.AHC的动作选择单元(ASE)由遗传算法优化的模糊推理系统(FIS)构成.ACE网络的输出构成二次强化信号,用于指导ASE的学习.最后将所提出的算法应用于移动机器人的行为学习,较好地解决了机器人的复杂路径跟踪问题.
其他文献
在课程思政视域下开展高校大学生社会实践成果"回归"理论课堂创新研究,对于改善我国高校教学中理论与实践脱节的问题具有关键作用,同时也可促进高校大学生社会实践能力的增长
“八五”期间,山西省临汾地区采取不断调整优化林业结构,提高经济效益;多方筹集资金,加大林业投入;加强领导,促进绿化达标,开展竞赛活动、重奖林业功臣;深化改革,落实林业政
【关键词】 数学教学;交互式电子白板;应用  【中图分类号】 G623.5 【文献标识码】 A  【文章编号】 1004—0463(2015)11—0100—01   交互式电子白板为师生提供了一个优秀的教育平台,使丰富的教育资源在课堂教学中得到充分的发挥,其独特的效能让课堂教学更加生动精彩,同时也让学生积极地参与到教学当中,大大提高了学习的自主性和积极性,达到了事半功倍的效果。下面,笔者就交互
最近,负责建造"超级环"的"超级环1号"公司公布一个重磅消息:全球第一条"超级高铁"将落户阿联酋迪拜。近日,"超级环1号"的首席执行官罗布·劳埃德已经与迪拜当地交通部门签署了商业
同志们: 今年是“八五”计划的最后一年,是为“九五”计划做好准备的关键一年,也是造林绿化走向21世纪的关键时刻,因此,《国土绿化》杂志召开这次编委会会议是很有意义的。
<正>巴加莫约港将成为东非最大的港口,带动国家的经济投资发展,从而促进坦桑尼亚实现2025年成为中等收入国家的发展目标坦赞铁路建成四十年后,中国和坦桑尼亚的伙伴关系将促
【摘 要】进行生物探究实验课是高中阶段培养学生动手能力、思考能力、总结归纳能力的主要途径。怎样上好每一节探究实验课,许多生物教师进行了相关的探究工作,让学生从死板的课本中走出来,进入到现实生活中去,把只会在课本中挖掘知识的学生们带到一个能激起学生兴趣的另一领域中去,让大家都动手,亲身感受其中的乐趣,从而去理解生物科学的进步是要不断地创新和实践的。  【关键词】生物 探究实验 兴趣 创新  普通高中
目的观察棕榈酸帕利哌酮长效针剂在急性期精神分裂症治疗中的疗效及安全性。方法对72例急性期精神分裂症患者随机分为棕榈酸帕利哌酮组和利培酮组,观察时间13周。于基线、治
会议
【摘 要】态势语是语言形式的一种,在课堂教学中起着重要的作用。教学态势语是教师思想观点、知识功底、教学技艺在教学过程中的具体体现,赋予课堂生机和个性。高水平的语文教学语言艺术,不仅可以丰富学生的知识,启迪学生的智慧,提高学生的思想水平,而且还能引起学生的美感,使他们得到一种美的享受和情的陶冶。因此,语文教师尤其要重视教学语言的艺术性。  【关键词】课堂 教学 态势语  教师的教学成功与否很大程度上
针对自动导引车的路径跟踪,提出一种基于运动预测的线性二次型调节器优化模型.在速度约束下,从全局角度通过运动预测达到多步控制的最优协调性.在目标函数中只包含速度控制量