rebel:一种将自我游戏强化学习和搜索范式推广到不完全信息游戏的算法 源码

spatial39191 9 0 ZIP 2021-04-19 10:04:13

反叛 实现,该算法将自我玩法强化学习和搜索的范式推广到不完全信息游戏。该存储库仅包含游戏的实现。 安装 推荐的安装ReBeL的方法是通过conda env。 首先,安装依赖项: pip install -r requirements.txt conda install cmake git submodule update --init 然后,编译C ++部分: make 培训价值网 使用以下命令通过在CPU上生成数据来训练价值网: python run.py --adhoc --cfg conf/c02_selfplay/liars_sp.yaml \ env.num_dice=1 \ env.num_faces=4 \ env.subgame_params.use_cfr=true \ selfplay.cpu_gen_threads=60 由于CF

用户评论
请输入评论内容
评分:
暂无评论