深度强化学习-分布式模块化框架 一个模块化框架,可实现即插即用的RL思想实验。 该系统是模块化的,具有针对演员,评论家,记忆,代理等的可重用类。 探索和学习在单独的Docker实例中作为单独的流程运行。 这样就可以运行多个分布式资源管理器。 这些组件在一个位置连接在一起,例如 , 。 急切地使用Tensorflow2。 跑 启动两个docker镜像,一个运行Explorer,另一个运行Learner。 scripts/both.sh 结果