keras实现REINFORCE算法强化学习

long_biti 82 0 2018-12-28 23:12:09

keras实现REINFORCE算法强化学习： # Policy Gradient Minimal implementation of Stochastic Policy Gradient Algorithm in Keras ## Pong Agent ![pg](./assets/pg.gif) This PG agent seems to get more frequent wins after about 8000 episodes. Below is the score graph.

文件列表

policy-gradient.tar.gz (预估有个56文件)

policy-gradient

pg.py 4KB

LICENSE 1KB

assets

pg.gif 1.81MB

score.png 13KB

README.md 262B

.git

logs

HEAD 201B

refs

heads

master 201B

remotes

origin

HEAD 201B

packed-refs 107B

info

exclude 240B

index 624B

objects

pack

471c2997bf5e63bf17ff6119080e38916d81d4 156B

2e1793c19e1aa36e3cec2cc0d17a5ed1dc6b1b 1KB

f01e2c6f7b6e0d122debfda4d6fae8cf7f39a0 1.04MB

61d8aff0d62095db0c61fbe6b90f3580e7e99e 652B

b62f87cf904442824ad1cc93327e86f75eb519 12KB

info

eaab4e4e16a2540cc1e568f96eb36c257b436b 97B

b702c583208c03bda5cf28f5b4ecb2e523faf2 180B

f7275d91756bcf89c29ded2809e88e63eeab0c 212B

1ac01dc0914116eb00ed07d69d23b05f5b08fa 1.65MB

76f4d30c5de266b2ba0d5d9dbd404d349e752a 202B

e5a5acc487bb7735d03376b9eb2af6b0e54a4a 1.04MB

baf423cc1def6e8807976ce08e470880d0eb28 179B

450470a57fe96cbc143e31458ecff6c269a35d 180B

41fd99009bbefd7119b6aef63ad26b0c12c159 127B

977145d79b62a9118f2760969f47b1ba39d22a 1KB

364f99fe4bf8d5262df3b19b33102aeaa791e5 615B

4ea3297aadb5c5b60582eb7dab7c4b84138ead 2KB

d46b8a5680cfde8f61f96662b44d2c2753abd1 1KB

0f2a6f7552e123ff21471f25a9e0295bc94e90 544KB

c7b93b8e9d5d7164f42b8183166df6017a0b8a 84B

ba0ed8a7ee7a9e7505e0e52d4c643c138455d3 180B

587e5735849d2e4a006ea804a736ac107d7d62 165B

e46b9063da1b2cd101cb5787cb97278813434a 121B

de7f9d51e8f5eb8cbc8fa4d97d655411089139 158B

1d140702420da646e2d3ad08a9bcce14d4808b 150B

5e531d422b6c299f1922b2e0cda16f12c3ab80 171B

3fdcb4de7c6d0c51604bf4f4a49f263ebddaad 2KB

528df9dbb9c2ecba5870f66816bf68d39c95aa 162B

c343c4938b86fd68a5cb14fdcd0d24e8b9ae29 158B

HEAD 23B

config 264B

refs

heads

master 41B

用户评论

暂无评论

强化学习课程讲义

GoogleDeepMind的DavidSilver的强化学习，人工智能学习资料

30 2019-04-29
强化学习动态规划

ComparisonofReinforcementLearningAlgorithmsappliedtotheCart-PoleProblem，APPLICATIONOFREINFORCEMENTLE

22 2019-05-02
强化学习PPT国外

强化学习PPTAnIntroductiontoRL-SuttonBook；AlgorithmsforRL

24 2019-05-13
DeepReinforcementLearning深度强化学习

DeepReinforcementLearning深度强化学习DeepReinforcementLearning,2017

61 2019-04-30
强化学习进阶书籍

ReinforcementLearning强化学习进阶书籍

34 2019-04-27
强化学习_冯超

强化学习精要核心算法与TensorFlow实现,原理细致，代码实现简洁

15 2019-04-29
强化学习策略梯度

CartPole，GridWorld，MountainCar，Pendulum，Toy

18 2019-07-25
分层强化学习综述

强化学习(reinforcement learning) 是机器学习和人工智能领域的重要分支,近年来受到社会各界和企业的广泛关注。强化学习算法要解决的主要问题是,智能体如何直接与环境进行交互来学习策略

13 2021-04-19
阿里强化学习.pdf

阿里强化学习.pdf

11 2021-05-19
强化学习综述.zip

强化学习综述,比较全面,内含详细原理介绍和公式推导

18 2021-04-22

keras实现REINFORCE算法强化学习

文件列表

用户评论

推荐下载