batch ppo:在TensorFlow中进行高效的批量增强学习 源码
批量PPO 该项目为强化学习提供了优化的基础架构。 它将扩展到多个并行环境,并允许在TensorFlow中实现代理并执行批量计算。 首先,我们提供BatchPPO,这是的优化实现。 如果您在研究中使用该项目的代码,请引用: @article { hafner2017agents , title = { TensorFlow Agents: Efficient Batched Reinforcement Learning in TensorFlow } , author = { Hafner, Danijar and Davidson, James and Vanhoucke, V
文件列表
batch-ppo-master.zip
(预估有个43文件)
batch-ppo-master
.travis.yml
405B
.pylintrc
806B
LICENSE
11KB
CONTRIBUTING.md
969B
AUTHORS
310B
agents
tools
in_graph_batch_env.py
6KB
count_weights.py
2KB
暂无评论