backgammon_classic_rl:使用经典强化学习技术解决步步高 源码
西洋双陆棋经典强化学习 使用经典强化学习技术解决步步高 计划 桑德:-) 西格德:-) 约尔根:-) 必须探索和理解时间差异学习和策略梯度学习。查找实现/可能使用的算法的示例。 什么是蒙特卡洛,什么是动态规划,什么是马尔可夫决策策略 健身房 我们正在使用健身房来训练强化学习模型 安装 如果没有pip环境-发出以下命令来创建一个环境 虚拟环境 然后激活虚拟环境 源环境/ bin /激活 克隆以下github存储库,其中包含健身房 git clone 将目录更改为健身房,并通过发出以下命令pip安装健身房 cd健身房步步高/ && pip install -e。 或者只需执行以下步骤即可运行安装脚本 首先通过发出以下命令使文件可执行chmod + x install_environment.sh 如果您尚未安装virtualenv,请为您的发行版进行安装。可以通过发出以下命令将其安装在Ubu
文件列表
backgammon_classic_rl-main.zip
(预估有个12文件)
backgammon_classic_rl-main
.gitignore
2KB
reduced_backgammon_gym
play_random_agent.py
3KB
README.md
6KB
.gitmodules
139B
install_environment.sh
809B
backgammon_simplified
__init__.py
150B
setup.py
121B
暂无评论