RL Pytorch:不同强化学习算法的实现 源码
强化学习算法-PyTorch 针对OpenAI体育馆环境的不同强化学习算法的PyTorch实现。 用法 要测试预先训练的网络:运行test.py或test_continuous.py 训练新网络:运行train.py或train_continuous.py 所有超参数都在train.py或train_continuous.py文件中 如果您尝试在操作维数= 1的环境中对其进行训练,请确保检查PPO类的update函数中的张量维,因为我已经使用过torch.squeeze()多次。 torch.squeeze()张量,使得没有长度= 1的尺寸( )。 收集经验的参与者数量=1。可以通过在
文件列表
RL-Pytorch-master.zip
(预估有个18文件)
RL-Pytorch-master
test.py
2KB
train.py
2KB
gif
PPO_LunarLander-v2.gif
1.16MB
PPO_BipedalWalker-v2.gif
3.37MB
LICENSE
1KB
tool
settings.py
576B
memory.py
396B
暂无评论