10.3969/j.issn.1000-386X.2011.11.024
基于模糊推理的多智能体强化学习
以电子市场智能定价问题为研究背景,提出基于模糊推理的多智能体强化学习算法(FI-MARL).在马尔科夫博弈学习框架下,将领域知识初始化为一个模糊规则集合,智能体基于模糊规则选择动作,并采用强化学习来强化模糊规则.该方法有效融合应用背景的领域知识,充分利用样本信息并降低学习空间维数,从而增强在线学习性能.在电子市场定价的对比实验中,智能体无论在合作还是在竞争的问题上都表现出较为长远的智能行为,提高了平均定价收益.
强化学习(RL)、多智能体系统(MAS)、模糊推理、电子市场
28
TP301.4(计算技术、计算机技术)
2011中国计算机大会论文.国家自然科学基金项目70802025
2012-03-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
96-98,107