《揭秘深度强化学习》彭伟完整版

H· 默 44 0 PDF 2019-05-19 11:05:57

深度强化学习（DeepReinforcementLearning，DRL）是深度学习算法和强化学习算法的巧妙结合，它是一种新兴的通用人工智能算法技术，也是机器学习的前沿技术，DRL算法潜力无限，AlphaGo是目前该算法*成功的使用案例。DRL算法以马尔科夫决策过程为基础，是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划（DP）的算法以及基于策略优化的算法，本书的目的就是要把这两种主要的算法（及设计技巧）讲解清楚，使算法研究人员能够熟练地掌握。《揭秘深度强化学习人工智能机器学习技术丛书》共10章，首先以AlphaGo在围棋大战的伟大事迹开始，引起对人工智能发展和现状的介绍，进而介绍深度强化学习的基