营救将军 健身房的混合竞争,合作,多主体强化学习环境。 要在单个GPU上依次运行ICML论文的结果 python ICML_paper_experiments.py 为了获得更快的结果,请在多个GPU上并行执行每次运行,并适当设置--device。 如果每张卡同时运行两个作业,则在4个RTX2080上这将需要4-5天。