强化学习的数学基础Mathmatical Foundation of Reinforcement Learning
这里是ShowMeAI持续分享的开源eBook系列内容覆盖机器学习深度学习数据科学数据分析大数据Keras TensorFlow PyTorch强化学习数学基础等各个方向.整理自各平台的原作者公开分享审核大大请放手◉ 简介这是新书强化学习的数学基础的书稿作者赵世钰现任西湖大学工学院智能无人系统实验室主任.2022年秋季是作者第四次教授强化学习的研究生课程撰写这份资料是为了弥补已有教材的不足.◉ 目录第2章贝尔曼方程是分析状态值的基本工具第3章贝尔曼最优方程是一个特殊的贝尔曼方程第4章值迭代算法是一种求解贝尔曼最优方程的算法第5章蒙特卡罗学习是第4章策略迭代算法的扩展第6章随机逼近的基础知识第7章时差学习第6章是本章的基础第8章扩展了表格时间对价值函数逼近情况的差分学习方法第9章策略迭代第10章actor critic方法
暂无评论