rllab 微调 源码
实验室 分层强化学习的子策略适应 要运行针对“分层强化学习的子策略调整”的论文的实验,请导航至sandbox/finetuning/README.md以查看说明。 引用子策略适应以进行分层强化学习 如果您将我们的代码用于学术研究,强烈建议您引用以下文章: 亚历山大·李(Alex C. “。”。 2020年第八届国际学习代表大会(ICLR)会议录。 贷记项目代码 我们以原始rllab代码以及由 (UC Berkeley / Covariant)开发的代码为。 (加州大学伯克利分校/ CMU)是该项目的主要开发商。 实验室 rllab是用于开发和评估强化学习算法的框架。 它包括各种各样的连续
文件列表
rllab-微调
(预估有个527文件)
Dockerfile
2KB
gpu_tf_Dockerfile
3KB
gpu_Dockerfile
2KB
visualize_hyperopt_results.ipynb
148KB
LICENSE
1KB
LICENSE
1KB
.gitignore
651B
Makefile
7KB
.gitignore
375B
main.html
15KB
暂无评论