一种深度强化学习空间关系与记忆融合方法研究

引用

摘要：

深度强化学习结合了深度学习在视觉上强大的感知能力来解决复杂环境的序列决策问题,但是由于采样效率低,对于复杂高维数据输入,学习其重要特征较为困难.为了从序列样本中更有效地提取信息,本文提出在深度强化学习中融合空间关系推理和记忆推理(Spatial Relationship Reasoning and Memory Reasoning,SRRMR)的模型结构.模型分为空间关系推理和记忆推理两部分,空间关系推理使用注意力机制作为空间关系学习方法隐式地推理任意两个实体间的关系,注意力机制中的查询向量融合了记忆推理的内容;记忆推理将输入图像的特征和关系作为记忆的输入,利用自注意力与记忆组成部分进行推理和交互,并将交互的结果存储在记忆单元中,使得记忆存储单元融合了空间信息与记忆信息.SRRMR模型在不同种类的Atari游戏中进行了训练和验证,结果表明,空间关系推理与记忆推理的融合在7/15个游戏环境中以更少的交互次数收敛到更好的结果,记忆推理网络在12/15个游戏中获得提升,提升智能体学习效率,更高效地利用序列中的样本,提高了强化学习的样本利用率.

关键词：空间关系推理、记忆推理、深度强化学习、注意力机制、状态表示

所属期刊栏目：46

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金;基础科研项目;黑龙江省自然科学基金项目;黑龙江省科技计划项目

在线出版日期：2023-04-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：814-826

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

一种深度强化学习空间关系与记忆融合方法研究