pytorch DQN:DQN的Pytorch实现源码

qqadmission57559 27 0 ZIP 2021-04-26 23:04:02

pytorch-DQN DQN的Pytorch实现 DQN 最初的Q学习使用表格方法(有关更多详细信息和实现,请参见 )来解决,但是,表格Q学习的问题在状态增长时出现因为table不足以存储环境中给定的数亿个状态。例如,环境为210x180黑白像素的游戏。将有$ 2 ^ {180 * 210} $个可能的状态,对于一个表来说,这太多了。 DeepMind通过深度神经网络以DQN形式将DQN形式的深度学习和Q学习相结合,以近似值,首先在游戏中击败人类。简而言之,DQN用深度神经网络(CNN或DNN)替换了表格,并使用目标网络来执行Bellman方程更新。为了实现它,使用了一些技巧,例如目标网络和体验重播。引入目标网络以收敛模型,因为频繁更新会使模型处于不稳定状态。体验重播使用缓冲区存储所有过去(状态,动作,next_state)对,并通过对过去的体验进行采样来训练模型,这有

文件列表

pytorch-DQN-main.zip (预估有个24文件)

pytorch-DQN-main

CartPole-v0.pth 74KB

train.py 4KB

agent.py 4KB

experience_replay.py 1KB

test.py 113B

images

mountainCar_result.gif 358KB

MountainCar.png 126KB

DQN.png 122KB

cartpole_result.gif 675KB

CartPole-v0-reward.svg 83KB

MountainCar-v0-reward.svg 85KB

CartPole-v0.gif 143KB

Q_network.py 1016B

.vscode

settings.json 78B

Q_network_pong.py 2KB

train_Pong.py 5KB

LICENSE 1KB

eval.py 2KB

README.md 4KB

runs

Mar18_14-56-52_WilliamdeMacBook-Pro.local

events.out.tfevents.1616050612.WilliamdeMacBook-Pro.local.1043.0 111KB

Mar18_14-53-31_WilliamdeMacBook-Pro.local

events.out.tfevents.1616050411.WilliamdeMacBook-Pro.local.96246.0 117KB

agent_pong.py 4KB

.gitignore 2KB

MountainCar-v0.pth 74KB

用户评论

暂无评论

torchgpipe PyTorch中的GPipe实现源码

火炬管实施。它针对CUDA(而非TPU)进行了优化。 from torchgpipe import GPipe model = nn . Sequential ( a , b , c , d )

5 2021-02-07
DeepForest pytorch用于树冠RGB检测的深林模型的Pytorch实现源码

深林火炬 DeepForest模型的pytorch实现,用于RGB图像中的单个树冠检测。 DeepForest是一个Python软件包,用于从机载RGB图像中训练和预测单个树冠。 DeepForest

19 2021-03-16
PyTorch Radial Basis Function Layer使用PyTorch的RBF图层模块的实现源码

PyTorch径向基函数(RBF)层使用PyTorch的RBF层/模块的实现。 RBF层是常规人工神经网络中使用的激活函数的替代方法。通常,RBF网络中的每个RBF层后面都有一个线性层。在RBF

13 2021-04-08
pytorch cpp面向所有人的PyTorch教程的C加加实现源码

面向所有人的PyTorch教程的C ++实现操作系统(编译器)\ LibTorch 1.7.0 每夜 macOS(clang 9.1) macOS(clang 10.0) macOS(clang 1

12 2021-02-06
Python强化学习DQN Flappy Bird

PlayingFlappyBirdUsingDeepReinforcementLearning(BasedonDeepQLearningDQN)

20 2019-06-03
8.quantile regression dqn.ipynb

关于quantile regression dqn的例子，适合初学者对深度强化学习quantile regression dqn认识和了解

6 2020-07-17
DQN_A3C_power_control.rar

采用了DQN、A3C算法,解决MIMO-NOMA网络中的子功率控制问题。代码中包含迫零波束赋形的方法,噪声考虑了加性白高斯噪声及衰落噪声两部分。

11 2020-11-06
keras搭建DQN训练Flappybird模型.zip

keras搭建DQN，构建FlappyBird智能体的模型，分别训练200轮以及github上下载的292轮模型

15 2020-07-16
深度强化学习DQN系列论文

深度强化学习系列论文,包括最基础的DQN,DQN模型改进,DQN算法改进,分层DRL,基于策略梯度的深度强化学习等等,论文基本源自顶会

18 2020-08-12
DQN最短路径MATLAB.zip

不用强化学习工具箱的DQN算法案例与matlab代码,方便大家学习使用。可以在此基础上直接更改编写自己的项目

156 2020-08-17

pytorch DQN:DQN的Pytorch实现 源码

文件列表

用户评论

推荐下载

pytorch DQN:DQN的Pytorch实现源码