期刊专题

10.3969/j.issn.1009-0134.2023.03.030

基于改进强化学习的机器人路径规划研究

引用
针对机器人在一些未知环境中使用强化学习中的Q学习算法做路径规划研究时收敛速度慢、规划路径长和搜索效率低等问题,提出一种改进强化学习算法.在Q学习算法中引入一种经验记忆力机制,能够基于从当前状态节点到起始点的最短距离的连续更新.该算法新设计的两个表的不同角色分配增强了机器人的自主学习能力,其中利用EM表来记录距离信息,反映了机器人对周围环境信息学习搜索的过程;指令表辅助Q表共同来帮助机器人规划路径并引导机器人安全地移动到终点.另外针对算法的过估计问题,设计了一种奖励机制,旨在防止机器人过度探索状态节点,避免在未知环境中盲目搜索.最后,利用Hermite曲线对路径进行平滑.从规划时间、迭代次数和路径长度的仿真结果表明,改进强化学习算法相较于Q学习算法在收敛速度和优化能力上均取得较大提高,能进一步提高机器人路径规划的效率.

未知环境、Q学习、经验记忆力机制、机器人、路径规划

45

TP242(自动化技术及设备)

卷接设备电控系统深度安全技术研究与应用项目;工业互联网创新发展工程项目

2023-03-30(万方平台首次上网日期,不代表论文的发表时间)

共5页

148-151,172

相关文献
评论
暂无封面信息
查看本期封面目录

制造业自动化

1009-0134

11-4389/TP

45

2023,45(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅