基于深度强化学习哈里斯鹰算法的路径规划
哈里斯鹰算法存在容易早熟、陷入局部最优陷阱、稳定性较差等问题.为了提升算法性能,本文提出了一种利用深度确定性策略梯度算法(DDPG)改进的哈里斯鹰算法.该改进将深度强化学习和启发式算法结合,利用深度确定性策略梯度算法训练神经网络,再通过神经网络动态地生成哈里斯鹰算法关键参数,平衡算法全局搜索和局部搜索,并赋予算法后期跳出局部最优陷阱的能力.通过函数优化和路径规划对比实验,实验结果表明,DDPGHHO算法具有一定的泛化性和优秀的稳定性,且在不同环境下均能够搜索到更优路径.
路径规划、深度确定性策略梯度算法、哈里斯鹰算法、深度强化学习
46
TP242.6(自动化技术及设备)
国家自然科学基金61461053
2023-09-04(万方平台首次上网日期,不代表论文的发表时间)
共8页
69-76