论文研究 对称协调博弈问题的多智能体强化学习.pdf
针对多机器人协调问题,利用协调博弈中智能体策略相似性,提出智能体的高阶信念修正模型和学习方法PEL,使智能体站在对手角度进行换位推理,进而根据信念修正将客观观察行为和主观信念推理结合起来。证明了信念修正模型的推理置信度只在0和1两个值上调整即可协调成功。以多机器人避碰为实验背景进行仿真,表明算法比现有方法能够取得更好的协调性能。
用户评论
推荐下载
-
论文研究腐败问题的博弈分析.pdf
论文研究-腐败问题的博弈分析.pdf, 从博弈的角度出发,利用决策分析手段,把腐败问题从政治经济中独立出来,在给出腐败一种新的定义的基础上,建立简单的博弈模型,在模型上求解,并对解进行了讨论分析.给
25 2020-07-17 -
最新智能交通系统的深度强化学习综述论文
最新的技术进步提高了交通运输的质量。新的数据驱动方法为所有基于控制的系统(如交通、机器人、物联网和电力系统)带来了新的研究方向。
24 2020-07-19 -
论文研究局部合作多智能体Q学习研究.pdf
强化学习在多Agent系统中面对的最大问题就是随着Agent数量的增加而导致的状态和动作空间的指数增长以及随之而来的缓慢的学习效率。采用了一种局部合作的Q-学习方法,只有在Agent之间有明确协作时才
35 2020-04-09 -
MATLAB强化学习_多臂赌机问题_时变egreedy策略
MATLAB强化学习代码包,用于解决多臂赌机问题的时变e-greedy策略 "I thought what I'd do was I'd pretend I was one of those
14 2020-07-23 -
C#做的强化学习的迷宫问题
用winform做的界面,用C#编写的利用强化学习算法解决迷宫的问题
43 2019-04-30 -
论文研究基于协调博弈的交通拥塞传播临界值研究.pdf
为深入分析交通网络的拥塞扩散过程,得出交通拥塞传播的临界值,提出了交通拥塞传播的协调博弈模型。通过网络个体之间的协调博弈,从出行者面对拥塞的决策行为出发,描述了交通网络的拥塞扩散过程。通过网络邻居之间
11 2020-07-23 -
强化学习研究综述_高阳.caj
强化学习研究综述的一篇论文,作者为高阳,陈世福等。2004年的,有点早了
25 2019-09-27 -
强化学习研究进展RL
关于强化学习(reinforce learning)的研究进展,以及分析,对于初始学习RL有不错的指导意义
19 2020-08-08 -
崇志宏强化学习和深度强化学习
深度学习在强化学习方面的应用所产生的深度强化学习取得快速发展。如何解释深度强化学习优势产生的原因是理解技术的基本方法。
72 2018-12-29 -
强化学习二
对于强化学习更深一层次的介绍
14 2020-10-14
暂无评论