ai traineree:用于(深度)强化学习的PyTorch代理和工具 源码
实习生 目的是建立一个深度强化学习方法的动物园,并展示它们在某些环境中的应用。 在文档中阅读更多信息: 。 为什么要另选一个? 主要原因是执行哲学。 我们坚信,代理应该出现在环境中,而不是相反。 大多数流行的实现都将环境实例传递给代理,就像代理是焦点一样。 这可能会简化某些算法的实现,但并不代表世界。 代理想要控制环境,但这并不意味着他们可以/应该。 那,然后使用PyTorch代替Tensorflow或JAX。 快速开始 要开始培训RL代理,您需要三件事:代理,环境和跑步者。 假设您要在OpenAI CartPole-v1上训练DQN代理: from ai_traineree.agents.dqn import DQNAgent from ai_traineree.env_runner import EnvRunner from ai_traineree.tasks impor
文件列表
ai-traineree:用于(深度)强化学习的PyTorch代理和工具
(预估有个105文件)
.gitignore
112B
pyrightconfig.json
179B
setup.cfg
2KB
manifest.json
41KB
tree.json
49KB
source.bat
434B
README.md
2KB
cdk.json
144B
.gitignore
118B
README.md
6KB
暂无评论