微软亚洲研究院秦涛_强化学习PPT
近年来,强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功,成为人工智能研究的热点。微软亚洲研究院的秦涛研究员在报告《强化学习简介》中对强化学习做一个简要介绍。该报告分为3个部分:1、强化学习基础,包括:马氏决策过程Bellman方程规划最优控制蒙特卡洛采样TD算法2、强化学习新算法,包括:基于值函数的算法基于策略函数的算法基于两者的混合算法3、强化学习所面临的挑战,如鲁棒性、样本效率等
用户评论
推荐下载
-
Sutton强化学习课程
Sutton早期开的强化学习课程合集,对强化学习的基础内容讲的比DavidSilver的课程更详细,更充实
47 2019-09-21 -
强化学习matlab代码
关于迷宫类的强化学习(Q-learning)matlab完整代码
16 2019-08-17 -
阿里强化学习资料
第一章基于强化学习的实时搜索排序策略调控;第二章延迟奖赏在搜索排序场景中的作用分析;第三章基于多智能体强化学习的多场景联合优化;第四章强化学习在淘宝锦囊推荐系统中的应用;第五章基于强化学习的引擎性能优
38 2019-09-06 -
强化学习TD算法
强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法,把环境的反馈作为输入、通过学习选择能达到其目标的最优动作
21 2019-09-14 -
强化学习课件.pdf
本课件讲解了强化学习的基本问题,经典Q学习理论,深度Q学习理论和程序讲解与训练。
24 2019-09-14 -
强化学习完flappybird
使用DQN自动玩flappybird,最近,github上有人放出使用DQN玩Flappy Bird的代码,https://github.com/yenchenlin1994/DeepLearning
39 2019-01-12 -
强化学习入门教材
强化学习有关的教材,涉及理论方面的推导和证明,有助于理解强化学习的代码,需要的可以下载!!!
19 2019-01-14 -
大规模强化学习
本书对连续状态空间的理论、算法及应用进行了研究和论述。主要包括:强化学习基本理论和大规模强化学习基本理论。
29 2019-01-17 -
csps强化学习程序
离散事件动态系统强化学习算法,多前视距离进行控制,在工件加工过程中优化前视距离,使得代价成本最小,获得最优策略
33 2019-01-19 -
深度强化学习_ImitationLearning
Imitation Learning • Also known as learning by demonstration, apprenticeship learning • An expert de
36 2019-02-16
暂无评论