论文部分内容阅读
目的针对应用在定制家具生产包装车间的板材搬运自动引导车存在的路径规划时间长以及规划出的路径转弯次数较多的问题,提出一种改进Q-learning算法的路径规划算法。方法根据定制家具生产包装车间环境情况,使用栅格法对车间进行建模,建立车间模型的人工标量场,使用人工标量场给予Q-learning算法前期搜索的目的性;增加Q-learning算法的学习层,使得算法可以更快进入收敛;在奖励函数中加入转弯惩罚,使得算法规划出的路径具有更少的转弯次数。结果仿真结果表明改进后的算法与标准Q-learning算法、增加学习