rubik:学习如何使用强化学习来解决魔方源码

citizenship26779 13 0 ZIP 2021-02-19 20:02:53

魔方学习如何使用强化学习来解决魔方状态模型正在学习一些东西。我尝试调整模型的结构,但无法达到低于18的损失,这似乎很高。仅需1个深度的贪婪搜索就足以解决5次旋转扰乱的多维数据集。下一步: 在get_td_value_examples和贪婪求解器中批量调用模型。实施A *。进一步调查模型的行为: 比损失多的指标(例如平均L1误差) 通过标签对度量进行切片:我们是否更擅长将立方体距已解决状态更近或更远? 以1 / {为打乱而进行的旋转次数}为单位进行举重训练示例。实现既有价值头又有政策头的模型实施MCTS。参考 Agostinelli,F.,McAleer,

文件列表

rubik-master.zip (预估有个15文件)

rubik-master

util.py 8KB

benchmarks.py 4KB

eval.ipynb 78KB

.pylintrc 64B

cube.py 18KB

Pipfile.lock 52KB

LICENSE 34KB

README.md 2KB

Pipfile 279B

util_test.py 4KB

.gitignore 2KB

cube_test.py 2KB

trainer.py 7KB

solver.py 13KB

solver_test.py 7KB

用户评论

暂无评论

我们一起学习强化学习

强化学习入门好资料-《强化学习精要-TensorFlow代码实现》，强化学习入门，高清，有标签PDF，方便阅读

32 2019-09-06
RL Stock用如何用深度强化学习自动炒股源码

:chart_increasing:如何用深度强化学习自动炒股 :light_bulb:初衷最近发生的事故,受到新冠疫情的影响,股市接连下降,作为一棵小白菜兼小韭菜,竟然产生了抄底的大胆想法,拿出仅

9 2021-04-07
Reinforcement_Learning强化学习研究源码

补强_学习资源双重Q学习图和强化学习使用Pytorch进行深度Q学习我们的讨论视频图论

5 2021-04-20
ReAllY您的强化学习盟友源码

真的您的强化学习盟友。基于tensorflow,RAY和Gym的框架,用于处理强化学习任务。一般说明该框架最初是为奥斯纳布吕克大学的“深度强化学习”基础课程构建的。在模块课程中,要求学生在框

12 2021-04-02
rl代码强化学习代码段源码

强化学习代码段如何运行安装要求 pip install -r requirements.txt 运行代码 cd value-based/tabular # test sarsa code pyth

8 2021-02-23
DeepRL Agents深度强化学习代理源码

深度强化学习代理该存储库包含以Tensorflow编写的强化学习算法的集合。这里编写的ipython笔记本是与我在发布的仍在进行中的教程系列一起编写的。如果您不熟悉强化学习,建议阅读随附的每种算

12 2021-02-23
MAgent多主体强化学习平台源码

该项目不再维护请参阅 ,以获取该项目的维护分支,该分支可以通过pip安装。代理 MAgent是用于多主体强化学习的研究平台。与以前的研究平台侧重于仅使用一个代理或仅几个代理进行强化学习研究的平台

24 2021-02-06
强化学习实战_强化学习在阿里的技术演进和业务创新

2018年10月出版的实体书版本，一共十四章，不是网上通常下载的12章的电子书。

36 2019-05-01
强化学习python代码notebook

强化学习python代码,notebook 各个强化学习热门代码实现 q-learning sarsa dqn dpg 下载自github 仅供参考侵删 ~~~~

16 2020-10-31
强化学习炒股Pytorch版

有朋友说想要个pytorch版的强化学习。我现在把2月9号文章的代码换成pytorch版本的了。代码不再做解释,与之前类似,只是把tf换成了torch。代码地址: https://github.co

55 2021-01-30

rubik:学习如何使用强化学习来解决魔方 源码

文件列表

用户评论

推荐下载

rubik:学习如何使用强化学习来解决魔方源码