open_spiel:OpenSpiel是用于游戏中一般强化学习和搜索计划研究的环境和算法的集合 源码
用户评论
推荐下载
-
自动化计划和强化学习研究自动化计划和强化学习的博士学位研究源码
自动化计划和强化学习研究:自动化计划和强化学习的博士学位研究
9 2021-02-23 -
深度强化学习在迷宫游戏中的应用
深度强化学习(Deep Q-Network,简称DQN)是一种基于神经网络的强化学习算法,在解决迷宫游戏等问题上具有很高的适用性。DQN的主要思想是通过训练神经网络来学习价值函数,实现智能体在环境中做
18 2023-07-01 -
用于一般指派问题的禁忌搜索算法
用于一般指派问题的禁忌搜索算法,窦晖,,本文研究了日常生活中常遇到的指派问题,并针对其特点,建立指派问题的数学模型。运用禁忌搜索算法来求解模型的最优解,通过对具
28 2020-06-02 -
多巴胺多巴胺是用于强化学习算法的快速原型制作的研究框架源码
多巴胺 多巴胺是用于强化学习算法的快速原型制作的研究框架。 它旨在满足对小型,易处理的代码库的需求,用户可以在其中自由地试验荒诞的想法(投机研究)。 我们的设计原则是: 轻松进行实验:使新用户可以轻松
5 2021-02-06 -
TextWorld TextWorld是一个沙箱学习环境用于在基于文本的游戏上训练和评估强化学习RL代理源码
文字世界 基于文本的游戏生成器和可扩展的沙箱学习环境,用于培训和测试强化学习(RL)代理。 另请访问以获取有关TextWorld及其创建者的更多信息。 对TextWorld有疑问或反馈吗? 将它们发送
10 2021-02-21 -
pyswopt用于一般优化目的的群智能算法集合源码
[py] thon做[sw] arm [opt]模仿 用于一般优化目的的群智能算法的集合。 该项目正在进展中。 请继续关注将来的更新。 我的目标是提供所有已知群体算法的集合,并提供解决各种优化问题的方
8 2021-02-23 -
freqtrade gym定制的健身环境用于开发和比较加密交易中的强化学习算法源码
健身操 该项目基于 该项目还处于初期阶段,因此您需要手动设置很多不便之处。 我正在努力改进。 安装 1. freqtrade 按照安装freqtrade 2.熊猫 pip install pandas
6 2021-03-16 -
论文研究网络规划中一般长度路线的简化算法.pdf
论文研究-网络规划中一般长度路线的简化算法.pdf, 本文给出了一般工序和路线中总时差和单时差的若干性质, 并从中发展出寻找路长不小于给定值的路线的算法, 并且用实例说明了这个算法的步骤。最后本文对
9 2020-07-25 -
强化学习的理论算法和应用指南.pdf
本文主要介绍了强化学习的基础理论、常用算法以及应用指南。强化学习作为一种机器学习方法,通过不断与环境交互来学习最优策略。文章首先介绍了强化学习的基本概念和数学原理,包括马尔可夫决策过程和贝尔曼方程等。
6 2023-07-22 -
Python TensorLayer用于TensorFlow的深度学习和强化学习库
TensorLayer:用于TensorFlow的深度学习和强化学习库
23 2020-07-26
暂无评论