商品推荐系统是当下机器学习算法应用中比较成熟的一个场景,当我们打开浏览器进入电商网站时,都可以看到在侧框出现的商品推荐。这些推荐的背后可能是很复杂的框架,如基于用户画像和历史购买数据的推荐引擎,也可能
一种基于深度强化学习的方法来解决网格路径规划问题。该方法利用深度神经网络进行价值估计,并采用Q-learning算法来指导路径规划。通过大量实验,我们发现该方法能够在处理复杂地图时取得很好的效果。
小车上山实验是强化学习经典案例,与网上大多数资源不同,该资源提供小车上山完整python代码,并以图形化的形式实现强化学习功能,值得一学。
深度强化学习的相关教程和代码
CuratedReinforcementLearningResourcesforNaturalLanguageProcessing
TensorForce: 用于应用强化学习的TensorFlow库
悬崖寻路为强化学习的经典案例,但网上关于这方面的代码几乎没有,该资源结合Gym库中的悬崖寻路问题进行了解答,并基于Bellman最优方程求解出最优策略,完整python代码,只此一家。
Q函数、greedy策略,强化学习基础实例,采用python语言代码实现
由于现实世界中并不能获取全部的state以及全部的action因此值迭代方法在很多问题上还是会有局限性.这时用到的就是Q Learning方法了
TensorLayer:用于TensorFlow的深度学习和强化学习库