警告:稳定的Baselines3当前处于测试版,发布1.0之前可能会发生重大更改。 稳定的基线3 稳定基准3(SB3)是PyTorch中增强学习算法的一组可靠实现。 它是“的下一个主要版本。 您可以在“ 阅读有关“稳定基准”的详细介绍。 这些算法将使研究团体和行业更容易复制,完善和识别新想法,并将创建良好的基准以在其上构建项目。 我们希望这些工具将被用作添加新想法的基础,以及将新方法与现有方法进行比较的工具。 我们还希望这些工具的简单性将使初学者可以尝试使用更高级的工具集,而不会陷入实现细节中。 注意:尽管使用简单,但稳定基线3(SB3)假定您对强化学习(RL)有所了解。 未经实践,您