RL Pytorch:不同强化学习算法的实现源码

sequence4404 13 0 ZIP 2021-02-25 06:02:52

强化学习算法-PyTorch 针对OpenAI体育馆环境的不同强化学习算法的PyTorch实现。用法要测试预先训练的网络:运行test.py或test_continuous.py 训练新网络:运行train.py或train_continuous.py 所有超参数都在train.py或train_continuous.py文件中如果您尝试在操作维数= 1的环境中对其进行训练,请确保检查PPO类的update函数中的张量维,因为我已经使用过torch.squeeze()多次。 torch.squeeze()张量,使得没有长度= 1的尺寸( )。收集经验的参与者数量=1。可以通过在

文件列表

RL-Pytorch-master.zip (预估有个18文件)

RL-Pytorch-master

test.py 2KB

train.py 2KB

gif

PPO_LunarLander-v2.gif 1.16MB

PPO_BipedalWalker-v2.gif 3.37MB

LICENSE 1KB

tool

settings.py 576B

memory.py 396B

train_continuous.py 2KB

test_continuous.py 2KB

prog

trainer.py 4KB

tester.py 2KB

README.md 2KB

algorithm

ppo.py 3KB

a2c.py 2KB

__init__.py 42B

network

rc_ac.py 3KB

__init__.py 34B

fc_ac.py 2KB

用户评论

暂无评论

强化学习资料

强化学习是机器学习领域的重要研究方向，本资料包括史忠植老师的强化学习PPT和国外RL教材。

40 2019-01-14
强化学习导论

强化学习导论，2018年1月完整版，Richard S. Sutton和 Andrew G. Barto所著

24 2019-01-14
强化学习阿里

第一章基于强化学习的实时搜索排序策略调控第二章延迟奖赏在搜索排序场景中的作用分析第三章基于多智能体强化学习的多场景联合优化第四章强化学习在淘宝锦囊推荐系统中的应用第五章基于强化学习的

41 2019-02-18
阿里强化学习

第一章基于强化学习的实时搜索排序策略调控 1 1.1 背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34 2019-02-18
强化学习讲义

机器学习的强化学习讲义第一章，学习强化学习快速上手推荐

209 2019-02-17
增强强化学习

强化学习(reinforcement learning，又称再励学习，评价学习)是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用

45 2019-03-02
分层强化学习

分层强化学习MAXQ文档，有助于对分层强化学习MAXQ的理解

19 2019-05-20
强化学习DQN

这本书详细介绍了强化学习的常用算法以及算法原理，从蒙特卡罗方法到Q_learning最终到DQN

38 2019-05-15
强化学习论文

深度学习中的强化学习相关论文，chatbot对话中使用，效果较好

29 2019-06-04
强化学习笔记

强化学习一些公式的推导和理解，主要是关于Sutton那本reinforcementlearning

32 2019-07-18

RL Pytorch:不同强化学习算法的实现 源码

文件列表

用户评论

推荐下载

RL Pytorch:不同强化学习算法的实现源码