基于改进DDPG算法的机器人路径规划算法研究

来源 :南京理工大学学报 | 被引量 : 0次 | 上传用户:q263742139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决深度强化学习训练时间长、收敛慢的问题,该文针对未知环境下的机器人路径规划,基于深度确定性策略梯度(DDPG)算法,结合人工势场法设计了回报函数。为了符合机器人运动学模型,设计连续的状态和动作空间。采用Python语言,在不同地图下分别使用人工势场法、原始DDPG和该文改进的DDPG算法进行仿真对比实验。改进的DDPG算法通过结合人工势场法,在训练中能够给予模型一定的指引,减少训练的盲目性和随机性,从而大大缩短训练时间,更早得到优化模型。训练1000回合后,原始DDPG算法的成功率为70%,改进DDP
其他文献
目的 制备一种新型冠状病毒(SARS-CoV-2)假病毒,并将其应用于抗体中和能力检测和抗体广谱性评估.方法 整合2种近期出现的SARS-CoV-2变异病毒株(20A.EU1和B1.1.7)刺突(spike,S
目的 探讨采用Percoll密度梯度离心结合免疫磁珠分选从人外周血富集白细胞层中分离提纯单核细胞的方法.方法 采用Ficoll密度梯度离心分离淋巴细胞得到外周血单个核细胞,Perco