NTU ReinforcementLearning Notes:国立台湾大学李宏毅老师讲解的深度强化学习学习笔记 源码
李宏毅深度强化学习笔记 课程主页: 视频: 李宏毅老师讲这门课不是从MDP开始讲起,而是从如何获得最佳奖励出发,直接引出政策梯度(以及PPO),再讲Q-learning(原始Q-learning,DQN,各种DQN的升级),然后是A2C(以及A3C,DDPG),紧接着介绍了一些Reward Shaping的方法(主要是好奇心,课程学习,分层学习) ,,最后介绍模仿学习(逆RL)。比较全面的展现了深度强化学习的核心内容,也比较直观。跟伯克利学派的课类似,与UCL上来就讲MDP,解各种值迭代的思路有悖论。文档中的注释以对幻灯片的批注为主,方便在阅读幻灯片时理解,代码以纯tensorflow实现,主要参考,修正部分代码以保持一致,已经加入理解的注释。 参考资料: 代码中的tensorlayer实现来自于 ,比起原生tensorflow更加简洁
用户评论
推荐下载
-
李宏毅教授一天搞懂深度学习
《1天搞懂深度学习》,300多页的ppt,台湾李宏毅教授写的,非常棒。不夸张地说,是我看过最系统,也最通俗易懂的,关于深度学习的文章。
17 2019-07-24 -
一天搞懂深度学习李宏毅.zip
一天搞懂深度学习--台湾大学电机工程学助理教授李宏毅讲义pdf
34 2019-07-24 -
李宏毅一天搞懂深度学习.rar
李宏毅一天搞懂深度学习PPT+markdown语法的笔记,由于现在csdn下载无法自行设置积分,给出SlidesShare链接(有梯子的可以直接去下面链接处下载):https://www.slides
13 2020-05-06 -
一天搞懂深度学习李宏毅pdf
深度学习(DeepLearning)是机器学习(MachineLearning)中近年来备受重视的一支,深度学习根源于类神经网络(ArtificialNeuralNetwork)模型,但今日深度学习的
31 2020-04-01 -
台大李宏毅_深度学习PPT之pdf版本
教程总体框架 什么是深度学习 深度学习中使用的各种tricks 递归式神经网络 深度学习应用与展望
15 2018-12-07 -
1天搞懂深度学习DPF李宏毅教授
《1天搞懂深度学习》,300多页的ppt,台湾李宏毅教授写的,非常棒。 不夸张地说,是我看过最系统,也最通俗易懂的,关于深度学习的文章。
5 2020-08-29 -
一天搞懂深度学习.李宏毅教授
一天搞懂深度学习.李宏毅教授
10 2020-08-31 -
台大李宏毅深度学习视频全1617完
台大李宏毅讲授的一天搞懂深度学习公开课的全部视频资料,还有之前上传的全部课件。由于上传量的限制,分开上传,请注意顺序。
19 2020-05-25 -
台大李宏毅一天搞懂深度学习
本文是2016台湾资料科学年会前导课程“一天搞懂深度学习”的全部讲义PPT(共268页),由台湾大学电机工程学助理教授李宏毅主讲。作者在文中分四个部分对神经网络的原理、目前存在形态以及未来的发展进行了
27 2020-06-21 -
李宏毅教授_一天搞懂深度学习
台湾李宏毅教授的深度学习教程,非常系统且入门的深度学习教程
32 2018-12-28
暂无评论