强化学习:强化学习算法的实现。 PythonOpenAI GymTensorflow 萨顿书和戴维·西尔弗课程的练习和解决方案 源码
总览 该存储库提供了流行的强化学习算法的代码,练习和解决方案。 这些旨在作为一种学习工具来补充来自 中的每个文件夹对应于上述教科书和/或课程的一个或多个章节。 除了练习和解决方案之外,每个文件夹还包含学习目标列表,简要概念摘要以及指向相关阅读材料的链接。 所有代码均使用Python 3编写,并使用RL环境。 先进的技术将用于神经网络实现。 目录 (WIP) (WIP) 学习与计划(WIP) 勘探与开发(WIP) 实施算法清单 优先体验重播(WIP)的深度Q学习 连续操作空间(WIP)的确定性策略梯度 深度确定性策略梯度(DDPG)(WIP) 资源资源 教科书: 类: 讲座/教程:
用户评论
推荐下载
-
sutton萨顿和巴托强化学习源码
强化学习:简介 的示例实验(图)和编程练习的Python实现 当我学习本书时,会添加章节。 有用的材料 (Rich Sutton的研究生) (DeepMind研究小组负责人) ((请查看他的个人。大量
22 2021-04-18 -
强化学习简介强化学习的Python实现简介源码
强化学习:简介 Sutton&Barto的书《Python复制 如果您对代码有任何疑问或要报告错误,请打开一个问题,而不是直接通过电子邮件发送给我,但是不幸的是,我没有关于本书的练习答案。 内
18 2021-02-21 -
Python强化学习算法的实现
这个库提供了代码,练习和受欢迎的强化学习算法的解决方案
40 2019-09-03 -
强化学习UML COMP5300麻省洛厄尔大学的强化学习课程源码
COMP5300-强化学习-UML 麻省洛厄尔大学COMP5300 / 4600强化学习课程
6 2021-02-27 -
强化haskell中的强化学习源码
强化:haskell中的强化学习
12 2021-02-25 -
强化学习算法解决Frozenlake环境
一种使用动态规划和Q学习算法来解决gym环境中的Frozenlake问题的方法。通过对比使用价值迭代和策略迭代算法,以及Q学习算法的效果,我们展示了使用Q学习算法解决Frozenlake问题的优势。文
15 2023-10-09 -
强化学习中的Q学习算法实现
强化学习(reinforcementlearning,又称再励学习,评价学习)是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。但在传统的机器学习分类中没有提到过强化学习,而在连接
38 2020-05-14 -
PythonPyTorch实现的强化学习算法集
PyTorch实现的强化学习算法集
24 2020-06-11 -
DQN强化学习算法的Python实现
DQN(Deep Q-Network)是一种基于深度学习的强化学习算法,本文提供了Python实现的DQN算法源代码,包括网络搭建、训练、预测等过程,并提供了详细的注释和说明。该源码适用于初学者学习和
7 2023-03-14 -
机器学习的强化学习
机器学习的强化学习讲义第3章,学习强化学习快速上手的学习材料
37 2019-02-17
暂无评论