backgammon_classic_rl:使用经典强化学习技术解决步步高源码

reminder_22071 4 0 ZIP 2021-04-04 23:04:39

西洋双陆棋经典强化学习使用经典强化学习技术解决步步高计划桑德:-) 西格德:-) 约尔根:-) 必须探索和理解时间差异学习和策略梯度学习。查找实现/可能使用的算法的示例。什么是蒙特卡洛,什么是动态规划,什么是马尔可夫决策策略健身房我们正在使用健身房来训练强化学习模型安装如果没有pip环境-发出以下命令来创建一个环境虚拟环境然后激活虚拟环境源环境/ bin /激活克隆以下github存储库,其中包含健身房 git clone 将目录更改为健身房,并通过发出以下命令pip安装健身房 cd健身房步步高/ && pip install -e。或者只需执行以下步骤即可运行安装脚本首先通过发出以下命令使文件可执行chmod + x install_environment.sh 如果您尚未安装virtualenv,请为您的发行版进行安装。可以通过发出以下命令将其安装在Ubu

文件列表

backgammon_classic_rl-main.zip (预估有个12文件)

backgammon_classic_rl-main

.gitignore 2KB

reduced_backgammon_gym

play_random_agent.py 3KB

README.md 6KB

.gitmodules 139B

install_environment.sh 809B

backgammon_simplified

__init__.py 150B

setup.py 121B

envs

s_backgammon.py 83KB

s_backgammon_env.py 2KB

__init__.py 80B

q_agent.py 7KB

rep.py 3KB

用户评论

暂无评论

rela强化学习大会源码

强化学习大会介绍 RL Assembly是和的实现的集合,以及必要的基础设施(如优先回放)和atari之类的环境。关键实施选择用于在C ++和Python之间同步模型的TorchScript 我

20 2021-04-07
trfl TensorFlow强化学习源码

TRFL TRFL(发音为“松露”)是在TensorFlow之上构建的库,它公开了一些用于实施强化学习代理的有用构建块。安装可以使用以下命令从pip install trfl : pip inst

24 2021-04-07
多主体强化学习源码

Udacity深度强化学习纳米学位-项目3:合作与竞争介绍对于这个Udacity项目,我使用了一个DDPG代理来解决多代理协作环境。在这种环境下,两名特工控制球拍在球网上弹跳球。如果探员将球击

16 2021-02-25
声波深层强化学习源码

声波深度强化学习项目概况对于我在Metis的热情项目,我想专注于学习本课程中未涵盖的机器学习范例,即强化学习(RL)。强化学习和该学科的神经网络版本,即深度强化学习(DRL),在技术上具有挑战性

8 2021-02-25
强化学习交易代理源码

强化学习交易代理贸易代理商: 问题解决者和供应商之间的交易商之间的纠纷 El数据集es acacado de“ yahoo”和las acciones analizar son las de app

19 2021-02-23
崇志宏强化学习和深度强化学习

深度学习在强化学习方面的应用所产生的深度强化学习取得快速发展。如何解释深度强化学习优势产生的原因是理解技术的基本方法。

72 2018-12-29
步步高视频转换器正版软件

步步高视频转换器正版软件,欢迎进入步步高官网查询

5 2020-10-06
步步高h2查看隐藏A盘程序

步步高h2的用户，还不知道怎样看A盘来试试哦！真好用哦！

11 2020-05-26
步步高HCD007198TSD说明书

步步高HCD007(198)TSD说明书

200 2018-12-09
步步高A系列侠客行金钱无限修改

修改侠客行金钱的一个小东西，不想跑着赚钱的就做下弊吧，呵呵易语言软件，用的话关闭360等杀毒软件，金山的话可能会修改失败，无毒无马

43 2018-12-09

backgammon_classic_rl:使用经典强化学习技术解决步步高 源码

文件列表

用户评论

推荐下载

backgammon_classic_rl:使用经典强化学习技术解决步步高源码