rebel:一种将自我游戏强化学习和搜索范式推广到不完全信息游戏的算法源码

spatial39191 9 0 ZIP 2021-04-19 10:04:13

反叛实现,该算法将自我玩法强化学习和搜索的范式推广到不完全信息游戏。该存储库仅包含游戏的实现。安装推荐的安装ReBeL的方法是通过conda env。首先,安装依赖项: pip install -r requirements.txt conda install cmake git submodule update --init 然后,编译C ++部分: make 培训价值网使用以下命令通过在CPU上生成数据来训练价值网: python run.py --adhoc --cfg conf/c02_selfplay/liars_sp.yaml \ env.num_dice=1 \ env.num_faces=4 \ env.subgame_params.use_cfr=true \ selfplay.cpu_gen_threads=60 由于CF

文件列表

rebel-master.zip (预估有个51文件)

rebel-master

conf

common

launcher

slurm.yaml 136B

optimizer

sgd.yaml 70B

radam.yaml 69B

adam.yaml 53B

ralamb.yaml 70B

c02_selfplay

liars_sp.yaml 759B

.gitmodules 237B

heyhi

__init__.py 15KB

scripts

clang_format_all.sh 784B

eval_all.py 5KB

.circleci

config.yml 2KB

run.py 4KB

requirements.txt 221B

CONTRIBUTING.md 2KB

cfvpy

utils.py 5KB

selfplay.py 25KB

models.py 3KB

tasks.py 685B

LICENSE 11KB

README.md 3KB

Makefile 349B

csrc

liars_dice

recursive_solving_test.cc 3KB

liars_dice.h 5KB

recursive_eval.cc 16KB

recursive_solving.h 4KB

subgame_solving_test.cc 11KB

net_interface.h 1KB

rela

model_locker.h 3KB

thread_loop.h 2KB

prioritized_replay.h 14KB

context.h 2KB

types.h 2KB

pybind.cc 9KB

data_loop.h 3KB

types.cc 3KB

subgame_solving.cc 40KB

tree_test.cc 4KB

CMakeLists.txt 3KB

stats.h 1021B

liars_dice.cc 2KB

real_net.h 1KB

util.h 3KB

liars_dice_test.cc 3KB

recursive_solving.cc 13KB

real_net.cc 5KB

tree.h 4KB

gen_benchmark.cc 5KB

subgame_solving.h 6KB

stats.cc 5KB

CODE_OF_CONDUCT.md 3KB

.gitignore 80B

third_party

googletest

pybind11

用户评论

暂无评论

OracleRMAN异机不完全恢复

此文档详细描述如果利用rman 完成不完全恢复。试验背景，步骤，命令，所有内容都做说明。

30 2019-02-17
STM32不完全手册

STM32不完全手册、STM32好教程

50 2019-03-18
绩效管理系统不完全代码

毕业设计，员工绩效管理系统，不完全代码。绩效管理系统。

20 2019-07-13
MINIstm32不完全手册

MINIstm32 incomplete manual

21 2019-06-27
stm32不完全手册

Stm32 not complete manual

21 2019-06-27
Openfire集群部署不完全手册

亲测可行的openfire集群实践手册，适合使用openfire做即时通讯方案的工程师做集群方案

31 2019-05-03
jira不完全工作手册

《jira不完全工作手册》，主流缺陷管理/流程管理软件，是QA，Test部门的工作利器。

24 2019-05-05
eachmovie不完全数据集

不完整的数据集，已经停止下载了，这里面包括用户对电影的评分数据和评分时候的时间，有2811983条数据

32 2019-07-17
中国各地美食不完全手册

成功最有效的是复制,并非所有复制能够起效果,希望整理发布的中国各地美食不完全手册能给你一...该文档为中国各地美食不完全手册,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看

15 2021-01-15
WMI脚本高手不完全手册

要成为WMI脚本高手当要认识一下什么叫WMI啦,下面将介绍一下有关WMI的东西。

10 2020-09-11

rebel:一种将自我游戏强化学习和搜索范式推广到不完全信息游戏的算法 源码

文件列表

用户评论

推荐下载

rebel:一种将自我游戏强化学习和搜索范式推广到不完全信息游戏的算法源码