reinforcement learning tutorials:强化学习的基本算法源码

qqsteam60747 18 0 ZIP 2021-04-21 21:04:21

写在前面本项目用于学习RL基础算法,尽量做到: 注释详细结构清晰代码结构清晰,主要分为以下几个脚本: env.py用于重建强化学习环境,也可以重新归一化环境,例如给动作加噪声 model.py强化学习算法的基本模型,局部神经网络,演员,评论家等 memory.py保存重放缓冲区,用于off-policy agent.py RL核心算法,某种dqn等,主要包含update和select_action两个方法, main.py运行主函数 params.py保存各种参数 plot.py利用matplotlib或seaborn补充奖励图,包括滑动平均的奖励,结果保存在结果文件夹中运行环境 python 3.7.9 pytorch 1.6.0 张量板2.3.0 火炬视觉0.7.0 体育馆0.17.3 使用说明本仓库使用到的环境信息请调整 ,在各个算法目录下也有相应的说明(如何

文件列表

reinforcement-learning-tutorials:强化学习的基本算法 (预估有个211文件)

events.out.tfevents.1609917610.MacBook-Pro.local.7620.0 11KB

events.out.tfevents.1609917610.MacBook-Pro.local.7620.1 8KB

events.out.tfevents.1602770377.MacBook-Pro.local.21607.1 9KB

events.out.tfevents.1602770377.MacBook-Pro.local.21607.0 12KB

events.out.tfevents.1609921125.MacBook-Pro.local.8900.0 2KB

events.out.tfevents.1602761057.MacBook-Pro.local.156.0 12KB

events.out.tfevents.1602761057.MacBook-Pro.local.156.1 9KB

events.out.tfevents.1604394206.MacBook-Pro.local.9371.1 9KB

events.out.tfevents.1604394206.MacBook-Pro.local.9371.0 12KB

events.out.tfevents.1606110786.MacBook-Pro.local.75770.1 13KB

events.out.tfevents.1606110786.MacBook-Pro.local.75770.0 40B

events.out.tfevents.1606389044.MacBook-Pro.local.21663.1 13KB

events.out.tfevents.1606389044.MacBook-Pro.local.21663.0 40B

events.out.tfevents.1606389110.MacBook-Pro.local.21831.1 13KB

events.out.tfevents.1606389110.MacBook-Pro.local.21831.0 40B

events.out.tfevents.1606122284.MacBook-Pro.local.78801.0 40B

events.out.tfevents.1606122284.MacBook-Pro.local.78801.1 13KB

events.out.tfevents.1606820959.MacBook-Pro.local.66871.0 40B

events.out.tfevents.1608619536.MacBook-Pro.local.35381.0 12KB

events.out.tfevents.1608619536.MacBook-Pro.local.35381.1 9KB

用户评论

暂无评论

强化学习笔记

强化学习一些公式的推导和理解，主要是关于Sutton那本reinforcementlearning

32 2019-07-18
深度强化学习

除了使徒直接去简历一个可以模拟承认大脑的程序之外，为什么不是图简历一个可以模拟小孩大脑的程序呢？如果他接受适当的教育，就会获得成人的大脑。

42 2019-07-11
强化学习Qlearning

智能Agent的主要特征之一就是能够适应未知环境，而在这一过程中，主动学习是至关重要的。在机器学习领域，大致可以将学习分为监督学习、非监督学习和强化学习3大类。

41 2019-07-11
flappybird强化学习

自动训练厉害的高分游戏。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

40 2019-04-28
模糊强化学习

用模糊强化学习，需预先设定模糊规则，本代码描述了Cartpole学习的强化学习过程，有兴趣可以学习一下

56 2018-12-15
强化学习综述

强化学习非常重要，强化学习内容有趣，强化学习相关资料

21 2019-07-23
强化学习实战

利用gym环境和Q-learning算法，在frozen_lake游戏中成功应用强化学习。

5 2024-05-01
强化学习PPT

第九章的技术文档可供参考。

1 2024-05-03
python强化学习

We use Machine Learning to constantly improve the performance of machines or programs over time. The

41 2019-01-07
基于强化学习的服务链映射算法

提出基于人工智能技术的多智能体服务链资源调度架构,设计一种基于强化学习的服务链映射算法。通过Q-learning的机制,根据系统状态、执行部署动作后的奖惩反馈来决定服务链中各虚拟网元的部署位置。实验结

10 2021-01-16

reinforcement learning tutorials:强化学习的基本算法 源码

文件列表

用户评论

推荐下载

reinforcement learning tutorials:强化学习的基本算法源码