10.3969/j.issn.1002-0640.2023.06.011
基于最近双经验SAC算法的无人分队控制研究
针对无人分队控制,如何进行行为决策以更好地完成任务,是当前无人驾驶的一个研究热点.基于SAC算法,提出最近双经验回放SAC算法模型.该模型主要从两方面入手:1)使用最近经验采样代替随机采样;2)使用双经验池代替单经验池.实验结果表明,改进后的SAC算法相比传统SAC算法,提升了学习效率与稳定性,降低了策略网络误差,使无人分队能有更高的任务成功率.
深度强化学习、SAC算法、最近双经验池回放、无人分队行为决策
48
TJ812(战车、战舰、战机、航天武器)
2023-08-02(万方平台首次上网日期,不代表论文的发表时间)
共7页
70-75,83