Q学习山车v0 源码
带Q学习和SARSA的MountainCar-v0 该项目包含用于培训代理商以解决。 Q-Learning和SARSA 山地车环境 环境是二维的,由两座山丘之间的汽车组成。 汽车的目标是到达右侧山顶的旗帜。 丘陵太陡峭,以至于仅通过向同一方向移动就无法缩放汽车,它必须后退并第四次建立足够的动力才能向上行驶。 观察空间: 这是两个确定环境当前状态的变量。 赛车在赛道上的位置,从-1.2到0.6 轿厢速度,从-0.07到0.07。 左为负,右为正。 动作: 汽车可以采取以下三种不同的动作之一: 向左加速 不要加速 向右加速。 报酬: 在每个步骤中,汽车会根据该操作后达到的状态获得奖励
用户评论
推荐下载
-
联想Q170Z170Q1X0MSBIOS支持6.7.8.9代U
联想Q170 ,Z170,Q1X0MS,BIOS 支持6789代U,另有知识库最新BIOS,可定制原机BIOS!
241 2020-11-02 -
ksks q源码
DQN打乒乓球 此仓库包含我对Deep Q网络的实现,该网络用于玩Pong的Atari旧游戏。 我已经使用PyTorch构建所需的神经网络。 Atari环境取自OpenAI体育馆
2 2021-04-24 -
pac q源码
Pac-Q Python中一个简单的“游戏”的个人项目,用于学习Pygame和Python。 需要:pygame:在Linux中:pip3安装pygame在MacOS中:pip3安装pygame ==
8 2021-03-09 -
电影Q源码
电影Q
1 2021-02-23 -
Q遥控V328
Q遥控V3.2.8
19 2019-02-21 -
搜Q v3.2
联合ChinaRen校友录,搜Q革命性推出了“Q版校友录”,将ChinaRen校友录嫁接在搜Q客户端,省去打开网页的繁琐。搜Q新闻中心,让您在聊天中尽收时讯。个人写真权限设置,私密性更高!音视频聊天,
8 2020-08-09 -
深度学习算法Q learning原理
Q-learning Q-learning 是 value-based 的方法,在这种方法中我们不是要训练一个 policy,而是要训练一个critic网络。critic 并不直接采取行为,只是对现有
32 2021-02-01 -
Q学习Linux嵌入式
RP4X12CV03型核心板是采用三星ARMCortex-A9芯片Exynos4412为主芯片,开发的一款多功能核心板。
20 2019-09-27 -
mma8451q学习笔记
典型应用有:电子罗盘,静态姿态、运动检测,笔记本电子书等便携设备的翻滚、自由落体检测,实时的方向检测
17 2019-09-03 -
q嵌入式学习路线
嵌入式的学习路线 具体书籍都有推荐 很好 跟着学肯定能明白大体的方向 不会感到迷茫
47 2018-12-07
暂无评论