一类Markov 决策过程自适应决策的新方法

coosplax 3 0 PDF 2021-02-19 21:02:34

提出一种计算效率高且能以任意给定精度实现决策近优的新方法。该方法的原理是根据要求 的决策精度对参数集进行有限分区,利用有偏极大似然估计器估计未知参数,并在决策过程中根据估计 参数所在的分区获得控制对 Markov 过程进行决策。

一类Markov 决策过程自适应决策的新方法

用户评论
请输入评论内容
评分:
暂无评论