一类Markov 决策过程自适应决策的新方法
提出一种计算效率高且能以任意给定精度实现决策近优的新方法。该方法的原理是根据要求 的决策精度对参数集进行有限分区,利用有偏极大似然估计器估计未知参数,并在决策过程中根据估计 参数所在的分区获得控制对 Markov 过程进行决策。
提出一种计算效率高且能以任意给定精度实现决策近优的新方法。该方法的原理是根据要求 的决策精度对参数集进行有限分区,利用有偏极大似然估计器估计未知参数,并在决策过程中根据估计 参数所在的分区获得控制对 Markov 过程进行决策。