车库:用于可重现强化学习研究的工具包 源码
车库 garage是用于开发和评估强化学习算法的工具包,并且是使用该工具包构建的最新实现的随附库。 该工具包提供了用于实现RL算法的多种模块化工具,包括: 可组合神经网络模型 重播缓冲区 高性能采样器 富有表现力的实验定义界面 再现性工具(例如,设置所有组件均尊重的全局随机种子) 记录到许多输出,包括TensorBoard 可靠的实验检查点和恢复 许多流行基准套件的环境接口 支持在各种环境中运行车库,包括始终最新的Docker容器 请参阅以获取入门说明和详细的API。 安装 pip install --user garage 例子 从v2020.10.0版本开始,garage附带了示例
文件列表
车库:用于可重现强化学习研究的工具包
(预估有个675文件)
.gitignore
2KB
Makefile
9KB
custom_env.ipynb
29KB
trpo_gym_tf_cartpole.ipynb
246KB
CODEOWNERS
96B
.dockerignore
62B
MANIFEST.in
490B
LICENSE
1KB
CHANGELOG.md
35KB
setup.cfg
2KB
暂无评论