RL2020_Building a Complete RL System_Demonstration:爱丁堡大学强化学习课程“构建完整的RL系统”讲座的演示代码
演示代码“构建完整的RL系统”讲座 介绍 此代码演示了我们对确定性FrozenLake任务的SARSA实现,并作为“构建完整的Rl系统”讲座的附加信息。 该讲座是爱丁堡大学一部分。 依存关系 要运行python代码,您将需要可以使用以下命令安装的 pip install gym 进一步的依赖关系是和 ,可以通过以下方式安装 pip install matplotlib pip install numpy Jupyter笔记本 我们强烈建议您在自己的时间阅读本演示的jupyter笔记本文件! 这包括进一步的信息和解释,以了解此演示并了解有关RL评估中的良好实践的更多信息。 您可以在直接查看笔记本也可以使用jupyter自己运行它。 要安装所需的软件并运行代码附带的笔记本电脑,请按照上的说明进行。 代码 所有代码都是用Python3编写的,并作为单独的脚本提供,并且全部集成在一个Jupyte
文件列表
RL2020_Building-a-Complete-RL-System_Demonstration-master.zip
(预估有个9文件)
RL2020_Building-a-Complete-RL-System_Demonstration-master
train_sarsa.py
6KB
plot_utils.py
2KB
Building_a_Complete_RL_System_lecture_slides.pdf
2.54MB
utils.py
2KB
human_player.py
2KB
rl_demo.ipynb
89KB
README.md
2KB
sarsa.py
3KB
.gitignore
3KB
暂无评论