基于Monte Carlo 粒子滤波的POMDPs 在线算法

shumi16425 10 0 PDF 2021-01-16 20:01:14

针对部分可观察马尔可夫决策过程(POMDPs) 的信念状态空间是一个双指数规模问题, 提出一种基于Monte Carlo 粒子滤波的POMDPs 在线算法. 首先, 分别采用粒子滤波和粒子映射更新和扩展信念状态, 建立可达信念状态 与或树; 然后, 采用分支界限裁剪方法对信念状态与或树进行裁剪, 降低求解规模. 实验结果表明, 所提出算法具有较 低的误差率和较快的收敛性, 能够满足系统实时性的要求.

用户评论
请输入评论内容
评分:
暂无评论