基于蒙特卡洛Q值函数的多智能体决策方法

qq_91353 10 0 PDF 2021-01-16 22:01:07

多智能体决策问题是人工智能领域的研究热点.与单智能体决策问题相比,多智能体决策的策略搜索空间更大.分布式局部感知马尔可夫决策过程(Dec-POMDPs)建立了不确定环境下多智能体决策问题的通用模型,自提出以来受到很大关注,但是求解Dec-POMDPs问题计算复杂度高,内存占用大.基于此,提出一种新的Q值函数表示-----蒙特卡洛Q值函数$(Q_MC)$,并从理论上证明$Q_MC$是最优Q值函数$Q^\ast$的上界,能够保证启发式搜索到最优解;运用自适应抽样方法,平衡收敛准确性和求解时间的关系;结合启发式搜索的精确性和蒙特卡洛方法随机抽样的一般性,提出一种基于$Q_MC$的蒙特卡洛聚类/扩展算

用户评论

暂无评论

用改进的蒙特卡洛MC方法计算VaR

用改进的蒙特卡洛（MC）方法计算VaR

27 2019-01-21
蒙特卡洛方法在数学建模中的应用

本文介绍蒙特卡洛方法在数学建模中的应用，包括随机数生成、粒子输运问题的解决、积分计算等多个方面。详细介绍了蒙特卡洛方法的概念和原理，并提供了常用蒙特卡洛程序介绍。该方法在数学建模中具有重要的应用价值，

9 2023-04-21
蒙特卡洛方法计算圆周率的数值

使用蒙特卡洛方法计算圆周率的数值

5 2021-04-04
微分加蒙特卡洛加蒙卡

暂无介绍

11 2020-07-17
趣味SQL使用蒙特卡洛方法计算圆周率Pi的值

圆周率(Pi)是圆的周长与直径的比值,一般用希腊字母 π 表示,是一个在数学及物理学中普遍存在的数学常数。π 也等于圆形之面积与半径平方之比,是精确计算圆周长、圆面积、球体积等几何形状的关键值。蒙特

13 2020-12-15
e语言人工智能学习蒙特卡洛算法

人工智能学习蒙特卡洛算法

11 2020-05-23
基于蒙特卡洛模拟的PHEV充电策略研究

基于蒙特卡洛模拟的PHEV充电策略研究，白雪峰，冯力勇，为了控制大量PHEV的自主充电给配电网带来的影响，基于蒙特卡洛模拟，分析了PHEV自主充电的负荷情况，结果表明大量PHEV自主充电会拉大

10 2020-05-22
基于蒙特卡洛的故障树仿真源代码

本文件是一个仿真程序的源代码，用蒙特卡洛的方法对故障树进行了仿真。

22 2019-07-13
基于R语言预测多风险因子VaR值的蒙特卡洛程序

完全估值法，可处理非线性、大幅波动与厚尾问题；利用计算机反复生成模拟数据，计算结果更具可靠性和精确性；利用风险因子变化的历史数据信息改善和修正随机模拟模型，对风险因子未来变化的模拟更贴近现实

18 2020-06-10
蒙特卡洛法算法.ppt

蒙特卡洛法算法.ppt

21 2020-12-20

基于蒙特卡洛Q值函数的多智能体决策方法

用户评论

推荐下载