这本书详细介绍了强化学习的常用算法以及算法原理,从蒙特卡罗方法到Q_learning最终到DQN
强化学习一些公式的推导和理解,主要是关于Sutton那本reinforcementlearning
除了使徒直接去简历一个可以模拟承认大脑的程序之外,为什么不是图简历一个可以模拟小孩大脑的程序呢?如果他接受适当的教育,就会获得成人的大脑。
智能Agent的主要特征之一就是能够适应未知环境,而在这一过程中,主动学习是至关重要的。在机器学习领域,大致可以将学习分为监督学习、非监督学习和强化学习3大类。
自动训练厉害的高分游戏。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
用模糊强化学习,需预先设定模糊规则,本代码描述了Cartpole学习的强化学习过程,有兴趣可以学习一下
强化学习非常重要,强化学习内容有趣,强化学习相关资料
利用gym环境和Q-learning算法,在frozen_lake游戏中成功应用强化学习。
第九章的技术文档可供参考。
Q强化学习matlab源代码,注释详细,本人亲自运行测试。