huskarl:深度强化学习框架+算法 源码
胡斯卡尔 Huskarl是专注于模块化和快速原型设计的深度强化学习框架。 它基于TensorFlow 2.0构建,并在可能的情况下使用tf.keras API以获得简洁性和可读性。 Huskarl使跨多个CPU内核的环境动态计算的并行化变得容易。 这对于加速基于策略的学习算法很有用,该算法可从多个并发的经验来源(例如A2C或PPO)中受益。 它对于计算密集型环境(例如基于物理的环境)特别有用。 与环境无缝。 计划支持多代理环境和。 演算法 实现了几种算法,并计划了更多算法。 深度Q学习网络(DQN) 多步DQN 双DQN 决斗架构DQN 优势演员评判(A2C) 深度确定性策
文件列表
huskarl-master.zip
(预估有个20文件)
huskarl-master
setup.py
674B
LICENSE
1KB
setup.cfg
89B
examples
ddpg-pendulum.py
2KB
dqn-cartpole.py
1KB
a2c-cartpole.gif
16.46MB
ddpg-pendulum.gif
13.88MB
a2c-cartpole.py
1KB
暂无评论