基于模型的强化学习的博弈论框架

qq_45867 18 0 PDF 2020-06-17 14:06:09

基于模型的强化学习(MBRL)最近获得了极大的兴趣，因为它具有潜在的样本效率和合并非策略数据的能力。然而，使用富函数逼近器设计稳定、高效的MBRL算法仍然具有挑战性。

资源预览

用户评论

暂无评论

博弈论上篇理解股市

博弈论上篇理解股市

25 2019-09-24
Game Theory博弈论教程

Game Theory: A Multi-leveled Approach. 全章节（带封面封底附录等）。通俗易懂的教程。

36 2018-12-25
博弈论_囚徒困境思路

根据纳什非合作博弈理论，博弈各方从个体理性出发，以最大最小化的原则采取策略，往往会陷入囚徒困境。但实际出现的囚徒困境要比理论所表明的要少的多，这说明现实生活中互动的人们之间存在着较强的协调性。为此，众

38 2019-01-07
博弈论中文版

作者：鲁宾斯坦（美）和奥斯本（加）。译者：魏玉根。

1184 2019-01-07
博弈论1Fudenberg

正如作者自己所说,这本书基于他们当时在MIT读phd时,Eric Maskin的笔记(字里行间确有Maskin的口气...)。毕业数年后,他们又修改整理,然后出书。此为压缩文件1,后面还有3个

5 2021-04-19
纳什均衡博弈论

纳什均衡介绍，对初学者有很大帮助，可以感受到博弈中的趣味

23 2020-07-26
博弈论2Fudenberg

接上一文件,为压缩文件2 。。。。。。。。。

2 2021-04-22
Nash著名博弈论论文

包括了博弈论大师Nash的最著名的几篇论文

34 2019-01-10
1基于深度模型的基于强化学习的多任务学习.pdf

SDN相关论文在分布式SDN中，实现了多个物理SDN控制器，每个控制器都管理一个网络域，以平衡集中控制，可伸缩性和可靠性要求。在这样的联网范例中，控制器彼此同步以维持逻辑上集中的网络视图。尽管提

35 2020-04-19
基于博弈论的门限签名体制分析与构造

为了使门限签名体制更具有普适性,引入了“理性参与人”的概念,将所有参与者视为理性的个体,任何阶段以最大化自身利益为目标。基于博弈论对密钥生成和签名合成阶段各参与者的策略和效用进行了分析,证明了在传统门

8 2021-01-16

基于模型的强化学习的博弈论框架

资源预览

用户评论

推荐下载