JAX RL:各种强化学习算法的JAX实现源码

yourselves6766 15 0 ZIP 2021-04-08 11:04:48

JAX-RL 各种深度强化学习算法的JAX实现。使用的主要库: JAX-主要框架 ku句-神经网络 Optax-基于梯度的优化算法: | 近端策略优化(PPO)| 1 | | 深度Q网络(DQN)| 1 | | 双深度Q网络(DDQN)| 1 | | 深度递归Q网络(DRQN)| 1 | | 深度确定性策略梯度(DDPG)| 1 | 政策: psi贪婪玻尔兹曼去做: 每种算法的完整测试其他基于PPO的算法? 优先体验重播多代理DQN和DDPG

文件列表

JAX-RL-main.zip (预估有个13文件)

JAX-RL-main

jax_rl

algorithms

drqn.py 6KB

__init__.py 127B

dqn.py 5KB

ppo.py 5KB

ddpg.py 5KB

base_agent.py 342B

buffer.py 3KB

utils.py 1015B

__init__.py 138B

policies.py 2KB

README.md 582B

tests

test_jax_rl.py 120B

.gitignore 2KB

用户评论

暂无评论

强化学习TD算法MATLAB程序

MALTAB例程，实现强化学习TD算法，为强化学习算法的学习者提供帮助

29 2019-02-24
强化学习最优路径寻找算法

通过强化学习算法，实现最短路径寻找，确定路径起点与终点，设置路径权重，完成路径规划。

21 2019-03-02
强化学习算法解决Frozenlake环境

一种使用动态规划和Q学习算法来解决gym环境中的Frozenlake问题的方法。通过对比使用价值迭代和策略迭代算法，以及Q学习算法的效果，我们展示了使用Q学习算法解决Frozenlake问题的优势。文

15 2023-10-09
深度强化学习PPO算法python

基于Tensorflow实现的PPO算法，依赖库：tensorflow-1.4及以上，gym

119 2018-12-26
强化学习算法原理入门

深度强化学习是人工智能领域的一个新的研究热点．它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合，并能够通过端对端的学习方式实现从原始输入到输出的直接控制．自提出以来，在许多需要感知高维

35 2018-12-28
强化学习Q_learning算法

Q-learning 是一种模型无关的强化学习方法，本文档使用Q-learning做了一个简单的搜索任务，有助于初学者理解强化学习，理解Q-learning.

28 2019-01-01
JavaWeb服务SOAP jax_ws和REST jax_rs规范

JavaWeb服务SOAP(jax-ws)和REST(jax-rs)规范，CXF整合Spring和未整合Spring的简单例子。结合说明看，简单易懂：my.oschina.net/lock0818/b

37 2018-12-17
机器学习的强化学习

机器学习的强化学习讲义第3章，学习强化学习快速上手的学习材料

37 2019-02-17
jax_ws jax_rs分别创建soap和restful类型的webservice

使用jax-ws和jax-rs，maven、java、spring分别创建soap类型的webservice和restful类型的webservice，文档附有代码

33 2019-06-05
restJersey使用Jersey JAX RS的REST源码

restJersey:使用Jersey JAX-RS的REST

6 2021-05-10

JAX RL:各种强化学习算法的JAX实现 源码

文件列表

用户评论

推荐下载

JAX RL:各种强化学习算法的JAX实现源码