期刊专题

10.3969/j.issn.2095-2783.2010.02.007

异质Agent间的知识迁移强化学习

引用
针对现有知识迁移方法仅适用于同质强化学Agent问题,提出一种能够在具有不同状态动作空间的异质Agent间迁移知识的Q学习算法.该算法的主要思想是通过新旧Agent共同学习过的任务,利用神经网络离线学习两Agent间的Q值函数映射关系,利用构造的Q值函数映射器把旧Agent学过而新Agent没有学过的任务的Q值映射到新Agent上,从而可以减少新Agem的学习尝试次数,提高学习速度.10×10格子世界仿真结果验证了所提知识迁移Q学习算法的有效性.

强化学习、知识迁移、异质Agent、Q值

5

TP18(自动化基础理论)

2010-04-26(万方平台首次上网日期,不代表论文的发表时间)

共4页

120-123

相关文献
评论
暂无封面信息
查看本期封面目录

中国科技论文在线

1673-7180

11-5484/N

5

2010,5(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅