我对艾尔的生活 该项目融合了DeepMind ,DeepMind的主演,OpenAI ,以及StarCraft II中的最佳策略-。 概述 《星际争霸2》是强化学习的丰富环境。 该游戏提供了,所有这些挑战通常会导致各种各样的问题。 我专注于星际争霸II的一种战略,该战略需要星际争霸II的全部行动空间的一部分,即神族大炮奔波。 我按照标准的光子大炮紧急建造顺序训练了仅限于建筑单元和结构的代理。 代理通过采用离散的A3C算法来学习对类似执行随机动作的代理的学习。 此实施为以前的工作做出了以下公共贡献: 第一个与PySC2 v3.0兼容的OpenAI Gym环境。 A3C首次应用于完整《星际