async_deep_reinforce:深度强化学习的异步方法源码

qqintention21312 11 0 ZIP 2021-02-21 04:02:03

async_deep_reinforce 异步深度强化学习关于试图改写Google Deep Mind的论文“深度强化学习的异步方法”。使用TensorFlow实现了播放“ Atari Pong”的异步优势演员批评(A3C)方法。 A3C-FF和A3C-LSTM均已实现。 26小时后的学习结果移动(A3C-FF)就是这样。在问题线程中强烈欢迎任何建议或建议。如何建造首先,我们需要构建Arcade Learning Enviroment的多线程就绪版本。我对其进行了一些修改以在多线程环境中运行它。 $ git clone https://github.com/miyosu

文件列表

async_deep_reinforce-master.zip (预估有个16文件)

async_deep_reinforce-master

.gitignore 33B

a3c_training_thread.py 6KB

rmsprop_applier_test.py 1KB

a3c.py 4KB

game_state_test.py 2KB

game_ac_network.py 11KB

game_state.py 2KB

a3c_visualize.py 2KB

LICENSE.txt 11KB

constants.py 833B

README.md 2KB

a3c_display.py 2KB

rmsprop_applier.py 4KB

graph_t5.png 67KB

graph_t20.png 50KB

pong.bin 2KB

用户评论

暂无评论

trfl TensorFlow强化学习源码

TRFL TRFL(发音为“松露”)是在TensorFlow之上构建的库,它公开了一些用于实施强化学习代理的有用构建块。安装可以使用以下命令从pip install trfl : pip inst

24 2021-04-07
多主体强化学习源码

Udacity深度强化学习纳米学位-项目3:合作与竞争介绍对于这个Udacity项目,我使用了一个DDPG代理来解决多代理协作环境。在这种环境下,两名特工控制球拍在球网上弹跳球。如果探员将球击

16 2021-02-25
声波深层强化学习源码

声波深度强化学习项目概况对于我在Metis的热情项目,我想专注于学习本课程中未涵盖的机器学习范例,即强化学习(RL)。强化学习和该学科的神经网络版本,即深度强化学习(DRL),在技术上具有挑战性

8 2021-02-25
强化学习交易代理源码

强化学习交易代理贸易代理商: 问题解决者和供应商之间的交易商之间的纠纷 El数据集es acacado de“ yahoo”和las acciones analizar son las de app

19 2021-02-23
Snake AI使用深度强化学习来学习玩Snake游戏源码

蛇艾当前的项目是游戏Snake的深度强化学习的实现。范围是显示AI蛇如何学会自己玩游戏。项目结构该代码分为以下软件包: game_src :实际游戏的源代码 snake_nn :深度学习实现的

27 2021-02-28
强化学习二

对于强化学习更深一层次的介绍

14 2020-10-14
强化学习原著

Thisintroductorytextbookonreinforcementlearningistargetedtowardengineersandscientistsinartificialint

15 2019-09-21
强化学习教材

ReinforcementlearningisanareaofMachineLearning.Reinforcement.Itisabouttakingsuitableactiontomaximize

28 2019-09-03
强化学习程序

用java写的一个强化学习程序，猫通过学习学会了抓老鼠

28 2019-09-04
强化学习算法

强化学习方面的ppt讲述了强化学习的方法，应用，强化学习的因素，分类，是个很好的ppt

28 2019-09-08

async_deep_reinforce:深度强化学习的异步方法 源码

文件列表

用户评论

推荐下载

async_deep_reinforce:深度强化学习的异步方法源码