网格世界 我认为强化学习的“你好世界”。 那么为什么要这样做呢? 我希望能够为机器学习代理提供更高级的环境,而Unity为此提供了极大的灵活性。 这更多是一个示例,说明如何从头开始创建Unity环境并直接使用Python与它交互。 这使用了一个自定义的双重DQN:一个用于本地,一个用于目标网络。 该代理基于屏幕上的原始像素学习。 安装 这分为两个部分。 一个专门安装PyTorch,而另一个专门安装其余依赖项。 您可以通过Unity或使用预构建的二进制文件来运行它。 如果您想要预建的游戏,则可以从抓取文件夹。 如果在Windows上运行,请确保获得Build在Mac上运行,请确保获得Build