backgammon_classic_rl:使用经典强化学习技术解决步步高 源码

reminder_22071 4 0 ZIP 2021-04-04 23:04:39

西洋双陆棋经典强化学习 使用经典强化学习技术解决步步高 计划 桑德:-) 西格德:-) 约尔根:-) 必须探索和理解时间差异学习和策略梯度学习。查找实现/可能使用的算法的示例。 什么是蒙特卡洛,什么是动态规划,什么是马尔可夫决策策略 健身房 我们正在使用健身房来训练强化学习模型 安装 如果没有pip环境-发出以下命令来创建一个环境 虚拟环境 然后激活虚拟环境 源环境/ bin /激活 克隆以下github存储库,其中包含健身房 git clone 将目录更改为健身房,并通过发出以下命令pip安装健身房 cd健身房步步高/ && pip install -e。 或者只需执行以下步骤即可运行安装脚本 首先通过发出以下命令使文件可执行chmod + x install_environment.sh 如果您尚未安装virtualenv,请为您的发行版进行安装。可以通过发出以下命令将其安装在Ubu

用户评论
请输入评论内容
评分:
暂无评论