pytorch rl:使用pytorch和visdom进行深度强化学习 源码
深度强化学习 火炬与视觉 训练有素的特工的样本测试(突破时使用DQN,乒乓球上使用A3C,CartPole上使用DoubleDQN,InvertedPendulum(MuJoCo)上使用连续A3C): 在Pong上训练A3C代理时具有16个学习者过程的示例在线绘图示例: 在CartPole上训练DQN代理时的示例日志记录(我们目前使用WARNING作为日志记录级别来摆脱来自visdom的INFO打印输出): [WARNING ] (MainProcess) < =================================== > [WARNING ] (MainProcess
文件列表
pytorch-rl-master.zip
(预估有个55文件)
pytorch-rl-master
models
.gitignore
71B
figs
.gitignore
71B
plot_compare.sh
3KB
core
models
dqn_cnn.py
3KB
empty.py
883B
暂无评论