基于分布式学习的编队控制与路径规划

来源 :南京大学 | 被引量 : 0次 | 上传用户:qq4156500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,多无人系统在众多实际领域中的应用越来越广泛,但在其系统控制上遇到的理论挑战也越来越大,所以对多智能体系统的研究一直是热点与难点。在分布式的智能体系统中,编队算法的研究一直是热门,研究目的是使得多智能体达到特定状态下完成特定任务。在多智能体分布式编队研究中,主要是从智能体的感知性能和相互作用的系统性结构这两方面对编队算法与结构进行研究。本文从多智能体系统的分布式编队算法开始研究,在确定的环境下,智能体间的编队队形保持一定的距离可以达到良好的编队效果。但在不确定的随机环境下,简单的队形结构无法保持编队的有效性,需要结合强化学习方法对环境的无模型学习,使得多个智能体能够保持低成本又有序高效的队形而优化编队。首先,本文研究基于Leader-Follower的拓扑结构,采用模糊Q学习实现领航者的避障。为了解决维数急剧增加的问题,采用概率模糊的方法将环境状态离散化,再利用Soft-max策略选择动作,从而加快学习与收敛的速度。通过数值仿真,充分验证了模糊Q学习的三维避障与避碰的有效性。然后,将模糊Q学习的策略用于队形保持和队形变换中。在二维平面中,跟随者间接使用到领航者学习到的策略,在避障过程中根据子任务的不同而灵活的选择队形,并且无碰撞到达目的地。最后,在不确定环境下,加入干扰因素增加了随机性,利用Q(λ)强化学习的方法完成跟随者的集群行为。将提出的学习策略与随机最优控制策略相比较,并在仿真实验中验证了该策略的可行性,使得智能体在不确定的随机环境下完成编队控制。
其他文献
无论是在学术领域还是在企业的实践中,对会计信息披露质量研究的热度从未消减过,而在研究的过程中也得出了一些有益的结论并为会计信息披露质量的提升提供了一些路径。如相关
在互联网+的时代里,公民个人信息的重要性是不言而喻的,它的运用渗透在人们工作和生活的方方面面,给人们的工作和生活,政府的管理以及企业的运行带来了很大程度上的方便,但是
目的 本课题通过临床观察针刺颈穴治疗瘀阻脑络型偏头痛的临床疗效,及其对颅内大脑前动脉(ACA)、大脑中动脉(MCA)、大脑后动脉(PCA)平均血流速度的影响,从而探讨本法治疗偏头
目的 探讨珊瑚羟基磷灰石(CHA)结合碱性成纤维细胞生长因子(bFGF)修复骨缺损的效果,为其临床、科研应用提供实验依据。方法 以CHA作为bFGF的可吸附性载体,制备成复合人工骨,将其
<正>国务院近日原则通过《关于2009年深化经济体制改革工作的意见》,决定调整固定资产投资项目资本金比例。此次调整带有明显的结构优化特
作为公认的政论著作,桓宽编纂的《盐铁论》虽是对盐铁会议的论辩纪要,但从传世文本看,它的文学色彩也是很明显的。可以说,这部作品是文学性的记言记事与史学性的实录相结合的
目的:观察小建中汤对脾胃虚寒模型大鼠血清白介素6(IL-6)和胃组织中胃泌素(GAS)含量的影响。方法:将48只动物随机分为6组,即空白对照组、小建中汤小剂量组、小建中汤中剂量组
随着电子产品的普及,人们阅读纸质书的习惯正越来越受到挑战,高中阶段正是培养学生良好的阅读习惯、拓宽知识面的重要时期;此外,近几年高考的阅读语篇时效性越来越强,对学生知识面的深度与广度提出了非常高的要求。因此,不论是为了满足学生升学的需要,还是为了促进学生日后的发展,培养他们阅读英语报的习惯是当务之急。《上海学生英文报》是上海本土的英文报刊,以其文章的时效性、趣味性而受到青睐,在笔者任教的上海市第八
本文主要研究了我国的校车市场。首先分析了消费者的行为,之后分析了校车的价格,最后结合市场分析的结果,给出了针对校车市场未来走向的建议。研究结果表明:校车市场潜力大,将达百
本文首先从国际背景的角度提出了品牌国际竞争时代已经到来这一基本结论,然后比较分析了中外知名品牌的差距及其原因,并阐明了品牌竞争力提升的一系列对策,最后就品牌竞争力