【摘 要】
:
为实现通过数据驱动学习人为操作下的无人艇集群最优协同控制策略,文中提出了一种线性二次型闭环微分博弈反演优化算法,根据观测到的系统最优状态和控制输入轨迹辨识协同策略
【基金项目】
:
国家自然科学基金重大项目课题(61991414)
论文部分内容阅读
为实现通过数据驱动学习人为操作下的无人艇集群最优协同控制策略,文中提出了一种线性二次型闭环微分博弈反演优化算法,根据观测到的系统最优状态和控制输入轨迹辨识协同策略目标函数。首先,根据观测到的含加性白噪声的最优系统状态和控制输入轨迹辨识最优反馈矩阵;然后,通过求解由纳什平衡充要条件推出的耦合代数黎卡提方程的解来辨识协同策略目标函数。所提出的反演优化算法能够获得满足给定系统状态和控制输入轨迹的最优协同策略目标函数;同时,该算法辨识出的目标函数可以用于实现针对特定任务场景的无人艇集群最优协同控制,并为集群的对抗
其他文献
为探讨强化训练的运动因素对足弓的影响,我们分析了某部新兵强化训练前后的足弓变化。
企业内各经济主体之间的契约关系是一种委托代理关系,企业融资方式选择及资本结构变化不仅表现为各利益相关主体组成的共同组织,而且由于信息不对称、契约的不完备等市场不完全
从晋代到宋代,古人对陶渊明诗文风格的品评,出现了一个由气到韵的转变。晋代钟嵘在《诗品》中指出渊明诗文中蕴含着阳刚之气,彰显了陶著“气”的风格;而宋代范温在《潜溪诗眼》中
1978年秋,中文考入台湾师范大学国文研究所硕士班,从伯元师习《广韵研究》与《古音研究》,初涉声韵之学。及进入博士班,又习《中国文字综合研究》,毕文字、声韵、训诂于一,而
近年来"情商"这个词频繁地映入人们的眼帘,情商越来越受到广大群众的关注,情商教育也开始被部分高校引入课程,然而我们都知道,每个人的童年时期是塑造其一生情绪倾向的关键时期