10.3969/j.issn.1001-0645.2004.05.008
一种多移动机器人协作围捕策略
提出一种在连续未知环境中实现多移动机器人协作围捕移动目标的整体方案.围捕包括包围目标和靠近目标,包围目标行为由强化学习算法实现.用状态聚类减小状态空间,利用Q学习算法获得Q值表,根据学习后的Q值表选择动作.对各种行为的输出进行加权求和获得综合行为,实现对移动目标的围捕.仿真实验获得了在不同条件下的围捕结果.结果表明,环境、hunter与prey的速度关系以及prey的逃跑策略对围捕效果都有影响.
多机器人、围捕、状态聚类、Q学习
24
TP242.6(自动化技术及设备)
国家部委预研基金40404070302
2004-07-02(万方平台首次上网日期,不代表论文的发表时间)
共5页
403-406,415