强化学习:基于Sutton和Barto的书(第2版)在Python中实施强化学习算法源码

generosity_61813 39 0 ZIP 2021-02-17 11:02:08

强化学习该存储库包括Sutton和Barto的强化学习书(Ed.2)算法的Python实现。该书第二版的最新草稿可以在此找到。在此存储库中,您还可以找到我一直在实施的练习书的解决方案。结构体夹该存储库分为几个文件夹,每个文件夹对应一本书的一章。通常,每个情节都与一组强化学习算法(例如,时差方法)有关。此外,在所有章节目录中,都存在一个notebooks子文件夹。此类文件是交互式Jupyter Notebook,用户可以在其中与OpenAI环境和可用算法进行交互。档案在主目录中找到的以下Python文件与该项目最相关: 包含用于强化学习任务的通用模型的实现。这样的一个

文件列表

Reinforcement-Learning-master.zip (预估有个35文件)

Reinforcement-Learning-master

8. Planning & Learning with Tabular Methods

algorithms.py 2KB

.gitignore 62B

6. Temporal Difference Learning

algorithms.py 6KB

notebooks

Q-Learning.ipynb 40KB

Double-Q-Learning.ipynb 28KB

Sarsa.ipynb 32KB

2. Multi-Armed Bandits

action_value.py 576B

agents.py 1KB

decision_making.py 1KB

Playground Notebook.ipynb 3KB

README.md 6KB

2.4.pdf 127KB

2.7.pdf 151KB

requirements.txt 920B

1. Introduction

README.md 5KB

LICENSE 1KB

.assets

Rl_agent.png 200KB

7. N Step Bootstrapping

algorithms.py 11KB

notebooks

n-Step Sarsa (Offline with Importance Sampling).ipynb 8KB

n-Step Sarsa.ipynb 29KB

n-Step Backup Tree.ipynb 38KB

4. Dynamic Programming

dp.py 3KB

notebooks

Policy Improvement.ipynb 3KB

Policy Evaluation.ipynb 3KB

Value Iteration.ipynb 3KB

Policy Iteration.ipynb 2KB

README.md 1KB

utils.py 1KB

README.md 2KB

visualize.py 851B

classes.py 4KB

5. Monte Carlo Methods

algorithms.py 6KB

notebooks

On-Policy First-Visit Average Sampling Control.ipynb 3KB

Off-Policy Weighted Importance Sampling Control.ipynb 3KB

README.md 0B

用户评论

暂无评论

强化学习PPT资源

主要介绍强化学习里面的一些重要概念和基本内容，PPT,总结的还不错，可以参考

25 2019-01-21
csps强化学习程序

离散事件动态系统强化学习算法，多前视距离进行控制，在工件加工过程中优化前视距离，使得代价成本最小，获得最优策略

33 2019-01-19
深度强化学习_ImitationLearning

Imitation Learning • Also known as learning by demonstration, apprenticeship learning • An expert de

36 2019-02-16
深度强化学习_QLearning

Introduction of Q-Learning Tips of Q-Learning Q-Learning for Continuous Actions

43 2019-02-17
深度强化学习_ProximalPolicyOptimizationPPO

Proximal Policy Optimization (PPO) default reinforcement learning algorithm at OpenAI Policy Gradien

44 2019-02-15
深度强化学习综述

深度强化学习综述,阐述近些年来深度学习方法的脉络，发展和概况，有助于读者快速了解深度强化学习整体概况

23 2019-03-02
RNN强化学习论文

人工智能中循环神经网络（RNN）、序列模型，强化学习方面的论文。

24 2019-03-09
深度强化学习简述

DeepreinforcementlearningispoisedtorevolutionisethefieldofAIandrepresentsasteptowardsbuildingautonom

26 2019-05-16
深度强化学习论文

深度强化学习简介，里面有应该看的论文，如果对深度强化学习感兴趣的，可以看看这个。

27 2019-06-04
强化学习DavidSilver课件

强化学习增强学习官网DavidSilver课件ReinforcementLearning视频地址https://www.bilibili.com/video/av9831889/

36 2019-04-29

强化学习:基于Sutton和Barto的书(第2版)在Python中实施强化学习算法 源码

文件列表

用户评论

推荐下载

强化学习:基于Sutton和Barto的书(第2版)在Python中实施强化学习算法源码