论文研究 基于一阶信念点的一阶POMDP值迭代算法研究.pdf

qq_31102354 12 0 PDF 2020-07-20 09:07:49

主要研究一阶部分可观测马尔可夫决策过程的近似求解方法。给出了一阶信念、一阶信念粒度、流关键度的概念;提出了基于流关键度的粒度归结方法,统一一阶信念粒度;提出了一阶信念粒度距离度量方法,提出FO-PBVI方法,将PBVI提升到抽象层面。通过Tiger和Tag实验对方法进行了验证分析,通过实验可见FO-PBVI方法能够很好地适应问题规模的变化,能够求解较大规模的规划问题。

论文研究 基于一阶信念点的一阶POMDP值迭代算法研究.pdf

用户评论
请输入评论内容
评分:
暂无评论