胡斯卡尔 Huskarl是专注于模块化和快速原型设计的深度强化学习框架。 它基于TensorFlow 2.0构建,并在可能的情况下使用tf.keras API以获得简洁性和可读性。 Huskarl使跨多个CPU内核的环境动态计算的并行化变得容易。 这对于加速基于策略的学习算法很有用,该算法可从多个并发的经验来源(例如A2C或PPO)中受益。 它对于计算密集型环境(例如基于物理的环境)特别有用。 与环境无缝。 计划支持多代理环境和。 演算法 实现了几种算法,并计划了更多算法。 深度Q学习网络(DQN) 多步DQN 双DQN 决斗架构DQN 优势演员评判(A2C) 深度确定性策