Acme:强化学习的研究框架 | | | Acme是增强学习(RL)代理和代理构建块的​​库。 Acme致力于公开简单,高效且易读的代理,这些代理既可以作为流行算法的参考实现,也可以作为强大的基准,同时仍提供足够的灵活性来进行新颖的研究。 Acme的设计还尝试以不同的复杂性级别为RL问题提供多个切入点。 总览 如果您只是想快速开始使用Acme,则要了解该库的主要知识是,我们公开了许多代理实现和一个EnvironmentLoop原语,可以按如下方式使用它: loop = acme . EnvironmentLoop ( environment , agent ) loop . run ()