深度学习与强化学习slide
深度学习强化学习最新讲义slide来自zhangrong不得不看
用户评论
推荐下载
-
深度强化学习的交叉熵优化与策略优化算法
压缩文件中有两个.py文件,分别为深度强化学习的交叉熵优化方法和策略优化方法的完整代码,readme文件中提供的资料中有具体的操作细节以及算法解释
32 2019-05-05 -
强化学习入门好资料_ 强化学习精要_TensorFlow代码实现
强化学习入门好资料-《强化学习精要-TensorFlow代码实现》,只需4个积分,有书签,高清,学习方便
38 2019-05-03 -
强化学习简介介绍强化学习的应用及理论.pptx
强化学习简介——介绍强化学习的应用及理论 包含视频
22 2020-08-09 -
强化学习笔记1
强化学习与监督学习的区别: (1)训练数据中没有标签,只有奖励函数(Reward Function)。 (2)训练数据不是现成给定,而是由行为(Action)获得。 (3)现在的行为(Action)不
11 2021-01-16 -
强化学习简介小册
强化学习方法的发展和应用才在这些领域占据了大量的研究人员。激发这种兴趣的是两个基本的挑战:1)设计能够在复杂动态环境中在不确定性下运行的自主机器人代理,2)为非常大规模的动态决策问题找到有用的近似解。
18 2020-04-28 -
强化学习课程资料
这是devil强化学习课程的ppt资料,为了方便,整理了一下
29 2019-09-21 -
Sutton强化学习课程
Sutton早期开的强化学习课程合集,对强化学习的基础内容讲的比DavidSilver的课程更详细,更充实
47 2019-09-21 -
强化学习matlab代码
关于迷宫类的强化学习(Q-learning)matlab完整代码
16 2019-08-17 -
阿里强化学习资料
第一章基于强化学习的实时搜索排序策略调控;第二章延迟奖赏在搜索排序场景中的作用分析;第三章基于多智能体强化学习的多场景联合优化;第四章强化学习在淘宝锦囊推荐系统中的应用;第五章基于强化学习的引擎性能优
38 2019-09-06 -
强化学习TD算法
强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法,把环境的反馈作为输入、通过学习选择能达到其目标的最优动作
21 2019-09-14
暂无评论