介绍<iframe src =“ ” width =“ 640” height =“ 480” frameborder =“ 0” allowfullscreen =“ true”> </ iframe>有关算法的详细说明,请检查。 抽象的 最近,有关强化学习的研究很多。 Q学习或DQN试图解决单人与环境的问题,而AlphaGo等其他方法则尝试双人游戏。在这个项目中,我们尝试找到一种算法来生成在多主体同步策略游戏中表现良好的主体。尽管此项目特定于称为Battlesnake的游戏,但我们使用的方法和算法不限于此。数学适用于具有有限状态和动作空间的任何同步游戏。 要求: 的Python 3.7.6 NumPy 1.18.1 TensorFlow 2.1.0 指示: 转到“代码”文件夹并运行train.py以开始训练模型。它将要求您输入内容。如果输入的起始迭代编号大于0,它将尝试开始使用现