演示代码“构建完整的RL系统”讲座 介绍 此代码演示了我们对确定性FrozenLake任务的SARSA实现,并作为“构建完整的Rl系统”讲座的附加信息。 该讲座是爱丁堡大学一部分。 依存关系 要运行python代码,您将需要可以使用以下命令安装的 pip install gym 进一步的依赖关系是和 ,可以通过以下方式安装 pip install matplotlib pip install numpy Jupyter笔记本 我们强烈建议您在自己的时间阅读本演示的jupyter笔记本文件! 这包括进一步的信息和解释,以了解此演示并了解有关RL评估中的良好实践的更多信息。 您可以在直接查看笔记本也可以使用jupyter自己运行它。 要安装所需的软件并运行代码附带的笔记本电脑,请按照上的说明进行。 代码 所有代码都是用Python3编写的,并作为单独的脚本提供,并且全部集成在一个Jupyte