暂无评论
强化学习精要核心算法与TensorFlow实现,原理细致,代码实现简洁
CartPole,GridWorld,MountainCar,Pendulum,Toy
强化学习(reinforcement learning) 是机器学习和人工智能领域的重要分支,近年来受到社会各界和企业的广泛关注。强化学习算法要解决的主要问题是,智能体如何直接与环境进行交互来学习策略
阿里强化学习.pdf
强化学习综述,比较全面,内含详细原理介绍和公式推导
ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lillicrap等人 。) 如何使用 git clone https://github.com/stev
用winform做的界面,用C#编写的利用强化学习算法解决迷宫的问题
1.1-1.强化学习简介 2.1-2.强化学习基本概念 3.1-3.马尔科夫决策过程 4.1-4.Bellman方程 5.1-5.值迭代求解 6.1-6.代码实战求解过程 7.1-7.Q-Learni
安装openAI的gym进行强化学习时,经常会遇到需要安装Box2D的情况,本资源为其Linux(Ubuntu)下的源码安装包。
补强_学习 资源 双重Q学习 图和强化学习 使用Pytorch进行深度Q学习 我们的讨论视频 图论
暂无评论