rl:深度强化交易学习源码

bend307 27 0 ZIP 2021-02-19 11:02:03

笔记本和代码张贴在强化学习上。玩Tic-Tac-Toe的基于表的强化学习,类似于无意义的深度学习算法 Keras从零开始构建深度强化学习算法,用于CartAI和LunarLander等OpenAI环境。 DQN 策略梯度(REINFORCE) 用基线加强 , 仅运行保存的好模型,不进行训练与UC Berkeley Ray项目相似但具有最先进的RL 受戈登·里特(Gordon Ritter)论文《机器学习交易》的启发, 交易假市场数据。这应该在运行。典型安装过程: 安装 python数据科学发行版使环境像 conda create --name tf tensorflo

文件列表

rl-master.zip (预估有个36文件)

rl-master

lunarlander.png 120KB

RL2.png 150KB

OU2.png 262KB

lunarlander.h5 18KB

SHMplus3.png 298KB

lunarlander.mp4 502KB

reinforce.h5 18KB

Trading_with_RL.ipynb 6.44MB

Ray_tune.py 2KB

model.h5 63KB

Tic-Tac-Toe.ipynb 39KB

model.json 2KB

llrb_good_predict.h5 18KB

V.csv 216KB

flowchart.png 69KB

Run_LunarLander.ipynb 29KB

requirements.txt 355B

good.h5 15KB

llrb_good_V.h5 22KB

Trading with RL.ipynb 6.44MB

StocksSHM2.png 144KB

SHMplus2.png 274KB

RL1.png 125KB

StocksSHM3.png 194KB

README.md 2KB

StocksSHM1.png 113KB

RLtable.png 195KB

Cart-Pole.ipynb 9.04MB

Run_CartPole.ipynb 19KB

Ray_tune.ipynb 123KB

OU3.png 313KB

good.p 2.31MB

lunarlander.mov 2.25MB

SHMPlus1.png 108KB

OU1.png 131KB

RL3.png 79KB

用户评论

暂无评论

深度强化学习综述x2

深度强化学习综述（刘全等）深度强化学习综述：兼论计算机围棋的发展

20 2019-05-25
PlaNet深度强化学习网络解析

PlaNet深度强化学习网络解析，Everything you need to know about Google’s new PlaNet reinforcement learning networ

34 2019-04-15
深度强化学习在aicar应用代码

基于gym的强化学习智能小车代码历程，包含Q_learning和policygradient的实现

24 2019-05-15
DeepMind关系型深度强化学习RelationalDeepReinforcementLearning

RelationalDeepReinforcementLearning--Weintroduceanapproachfordeepreinforcementlearning(RL)thatimprov

34 2019-07-11
深度强化学习基于人类偏好.pdf

基于人类偏好的深度强化学习方法，通过分析人类的行为数据和偏好，将其纳入强化学习框架中进行训练，从而提高智能体的决策能力和学习效果。算法采用了深度神经网络和强化学习算法的结合，通过对人类偏好的建模和学习

12 2023-07-22
深度强化学习mujoco平台搭建指南

详细总结了如何在ubuntu16.04的基础上搭建深度强化学习mujoco的环境，可按照Openai的gym针对mujoco-py进行深度强化学习训练，解决了mujoco安装后，Ubuntu重启键盘鼠

38 2019-01-09
Snake AI使用深度强化学习来学习玩Snake游戏源码

蛇艾当前的项目是游戏Snake的深度强化学习的实现。范围是显示AI蛇如何学会自己玩游戏。项目结构该代码分为以下软件包: game_src :实际游戏的源代码 snake_nn :深度学习实现的

27 2021-02-28
jax_rl具有连续动作空间的深度强化学习的软演员关键SAC的Jax亚麻实现源码

贾克斯(亚麻)柔软演员评论家这是的Jax(Flax)实现,。该存储库的目标是提供一个简单而干净的实现,以在此基础上进行研究。请不要将此存储库用于基线结果,而应使用SAC的原始实现。安装安装并

9 2021-04-08
rapid policy transfer rl强化学习中的快速政策转移毕业项目源码

该Github存储库包含“高级毕业项目”的代码,“分析用于快速策略传输的策略梯度方法”。它是使用PyTorch 1.6.0和更高的高阶梯度库实现的,并且包括多种RL策略梯度算法的常见实现的功能形式。

7 2021-04-18
backgammon_classic_rl使用经典强化学习技术解决步步高源码

西洋双陆棋经典强化学习使用经典强化学习技术解决步步高计划桑德:-) 西格德:-) 约尔根:-) 必须探索和理解时间差异学习和策略梯度学习。查找实现/可能使用的算法的示例。什么是蒙特卡洛,什么是

4 2021-04-04

rl:深度强化交易学习 源码

文件列表

用户评论

推荐下载

rl:深度强化交易学习源码