面向多目标参数整定的协同深度强化学习方法

引用

摘要：

多目标控制参数联合优化整定是自动化系统保持高效、稳定运行的关键问题,强化学习常用于建立自动化调参智能体,代替人工完成参数整定.针对现有方法使用固定权重将多个优化目标线性组合为单目标,训练具有固定调参知识的单智能体模型,导致实际目标关系受环境影响与先验不符时,智能体无法感知并做出适应性决策调整,限制参数整定效果的问题,提出一种面向多目标参数整定的协同深度强化学习方法.该方法利用离线仿真学习目标整定知识建立多个Double-DQN智能体,在线建立整定效果反馈,感知目标实际关系并调整智能体协同策略,实现有效的多目标参数整定.列车自动驾驶参数整定实验结果表明,方法对停车误差、舒适度两个目标整定效果良好,能自适应不同车轨性能且可持续优化,实用价值大.

关键词：参数整定、多目标、强化学习、自动化系统、协同

所属期刊栏目：42

分类号：TP273(自动化技术及设备)

在线出版日期：2022-09-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：969-975

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

面向多目标参数整定的协同深度强化学习方法