10.3969/j.issn.1007-7375.2021.04.011
基于多智能体强化学习的自动化电力仓库货位优化
自动化仓库的货位优化是提高仓库效率的重要途经之一.本文针对电力仓库货位优化问题,采用基于多智能体强化学习的方法,提升优化效果.首先分析DDPG算法和MADDPG等算法的不足;然后在此基础上提出改进算法ECS-MADDPG及其模型.在该算法中,同时考虑当前时间点的即时奖励和未来奖励因素;最后利用电力物资的历史出入库数据,应用强化学习算法训练货位优化模型.研究表明,与MADDPG、DDPG等算法相比,ECS-MADDPG拥有较高的稳定性和回报值.
电力仓库;货位优化;多智能体强化学习
24
TP13(自动化基础理论)
2021-09-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
93-99