DOI：10.3969/j.issn.1002-0640.2023.06.011

基于最近双经验SAC算法的无人分队控制研究

引用

摘要：

针对无人分队控制,如何进行行为决策以更好地完成任务,是当前无人驾驶的一个研究热点.基于SAC算法,提出最近双经验回放SAC算法模型.该模型主要从两方面入手:1)使用最近经验采样代替随机采样;2)使用双经验池代替单经验池.实验结果表明,改进后的SAC算法相比传统SAC算法,提升了学习效率与稳定性,降低了策略网络误差,使无人分队能有更高的任务成功率.

关键词：深度强化学习、SAC算法、最近双经验池回放、无人分队行为决策

所属期刊栏目：48

分类号：TJ812(战车、战舰、战机、航天武器)

在线出版日期：2023-08-02（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：70-75,83

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

基于最近双经验SAC算法的无人分队控制研究