用Jax实现的深度强化学习算法 使用Jax实施深度强化学习。 在OpenAI健身房CartPole环境中进行测试。 演算法 DQN- 具有目标网络的DQN- 用法 # Install deps pip install -r requirements.text 训练模式 # Using launch script, by default set up to run multiple seeds ./launch.sh # Using python python3 run.py --agent dqn --train_eps 100 --n_layers 3 --seed 1 --test_eps 30 --lr 0.03 --batch_size 256 --warm_up_steps 500 --epsilon_hlife 1500 --save_dir out/CartPole-