async_deep_reinforce:深度强化学习的异步方法 源码
async_deep_reinforce 异步深度强化学习 关于 试图改写Google Deep Mind的论文“深度强化学习的异步方法”。 使用TensorFlow实现了播放“ Atari Pong”的异步优势演员批评(A3C)方法。 A3C-FF和A3C-LSTM均已实现。 26小时后的学习结果移动(A3C-FF)就是这样。 在问题线程中强烈欢迎任何建议或建议。 如何建造 首先,我们需要构建Arcade Learning Enviroment的多线程就绪版本。 我对其进行了一些修改以在多线程环境中运行它。 $ git clone https://github.com/miyosu
文件列表
async_deep_reinforce-master.zip
(预估有个16文件)
async_deep_reinforce-master
.gitignore
33B
a3c_training_thread.py
6KB
rmsprop_applier_test.py
1KB
a3c.py
4KB
game_state_test.py
2KB
game_ac_network.py
11KB
game_state.py
2KB
a3c_visualize.py
2KB
LICENSE.txt
11KB
暂无评论