open_spiel:OpenSpiel是用于游戏中一般强化学习和搜索计划研究的环境和算法的集合源码

mouth1151 9 0 ZIP 2021-02-07 04:02:24

OpenSpiel:游戏中强化学习的框架 OpenSpiel是用于一般强化学习和游戏中搜索/计划研究的环境和算法的集合。 OpenSpiel支持n玩家(单人和多人)零和,合作和一般和,单发和顺序,严格的回合和同时移动,完美和不完美的信息游戏,以及传统的多人环境例如(部分和完全可观察的)网格世界和社会困境。 OpenSpiel还包括用于分析学习动态和其他常见评估指标的工具。游戏被表示为程序扩展形式的游戏,具有一些自然的扩展。核心API和游戏以C ++实现,并公开给Python。算法和工具都是用C ++和Python编写的。 swift子目录中还有一个纯Swift分支。要在Google

用户评论

暂无评论

自动化计划和强化学习研究自动化计划和强化学习的博士学位研究源码

自动化计划和强化学习研究:自动化计划和强化学习的博士学位研究

9 2021-02-23
深度强化学习在迷宫游戏中的应用

深度强化学习（Deep Q-Network，简称DQN）是一种基于神经网络的强化学习算法，在解决迷宫游戏等问题上具有很高的适用性。DQN的主要思想是通过训练神经网络来学习价值函数，实现智能体在环境中做

18 2023-07-01
用于一般指派问题的禁忌搜索算法

用于一般指派问题的禁忌搜索算法，窦晖，，本文研究了日常生活中常遇到的指派问题，并针对其特点，建立指派问题的数学模型。运用禁忌搜索算法来求解模型的最优解，通过对具

28 2020-06-02
多巴胺多巴胺是用于强化学习算法的快速原型制作的研究框架源码

多巴胺多巴胺是用于强化学习算法的快速原型制作的研究框架。它旨在满足对小型,易处理的代码库的需求,用户可以在其中自由地试验荒诞的想法(投机研究)。我们的设计原则是: 轻松进行实验:使新用户可以轻松

5 2021-02-06
TextWorld TextWorld是一个沙箱学习环境用于在基于文本的游戏上训练和评估强化学习RL代理源码

文字世界基于文本的游戏生成器和可扩展的沙箱学习环境,用于培训和测试强化学习(RL)代理。另请访问以获取有关TextWorld及其创建者的更多信息。对TextWorld有疑问或反馈吗? 将它们发送

10 2021-02-21
pyswopt用于一般优化目的的群智能算法集合源码

[py] thon做[sw] arm [opt]模仿用于一般优化目的的群智能算法的集合。该项目正在进展中。请继续关注将来的更新。我的目标是提供所有已知群体算法的集合,并提供解决各种优化问题的方

8 2021-02-23
freqtrade gym定制的健身环境用于开发和比较加密交易中的强化学习算法源码

健身操该项目基于该项目还处于初期阶段,因此您需要手动设置很多不便之处。我正在努力改进。安装 1. freqtrade 按照安装freqtrade 2.熊猫 pip install pandas

6 2021-03-16
论文研究网络规划中一般长度路线的简化算法.pdf

论文研究-网络规划中一般长度路线的简化算法.pdf, 本文给出了一般工序和路线中总时差和单时差的若干性质, 并从中发展出寻找路长不小于给定值的路线的算法, 并且用实例说明了这个算法的步骤。最后本文对

9 2020-07-25
强化学习的理论算法和应用指南.pdf

本文主要介绍了强化学习的基础理论、常用算法以及应用指南。强化学习作为一种机器学习方法，通过不断与环境交互来学习最优策略。文章首先介绍了强化学习的基本概念和数学原理，包括马尔可夫决策过程和贝尔曼方程等。

6 2023-07-22
Python TensorLayer用于TensorFlow的深度学习和强化学习库

TensorLayer：用于TensorFlow的深度学习和强化学习库

23 2020-07-26

open_spiel:OpenSpiel是用于游戏中一般强化学习和搜索计划研究的环境和算法的集合 源码

用户评论

推荐下载

open_spiel:OpenSpiel是用于游戏中一般强化学习和搜索计划研究的环境和算法的集合源码