10.3969/j.issn.1000-3932.2018.02.012
基于深度Q学习的工业机械臂路径规划方法
将机械臂避障路径规划问题置于强化学习的框架当中,采用深度Q学习的方法训练策略以规划路径,使得机械臂能够在空间中存在障碍物的情况下实现避障抓捕.生成的策略以神经网络的形式表示,通过经验回放和目标网络的方法解决以神经网络拟合Q函数时网络难以收敛的问题.最后在MuJoCo仿真环境上验证了该方法的有效性.
机械臂、避障、路径规划、强化学习、深度Q学习
45
TP241.2(自动化技术及设备)
2018-03-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
141-145,171