10.3321/j.issn:0372-2112.2009.01.023
发现和学习不可复位动态系统的预测状表示的一种新算法
提出了一种发现和学习不可复位动态系统的预测状态表示的新算法.在证明系统的任意landmark均可作为系统的初始状态的基础上,利用发现的landmark确定系统在任意时间步所处的经历,然后采用蒙特卡罗方法估计任意经历下任意检验发生的概率,解决了在不可复位动态系统中,经历下检验发生的概率难以获取问题,进而发现和学习不可复位动态系统的预测状态表示.实验结果表明,本文算法获得的系统的预测状态表示在预测精度上明显优于suffix-history算法,验证了所提算法的有效性.
预测状态表示、不可复位动态系统、landmark、suffix-history算法
37
TP181(自动化基础理论)
国家"211工程"资助;西安交通大学"行动计划"资助
2009-04-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
126-131