本项目灵感源自于AlphaGo Zero,旨在通过培训一个深度神经网络,使其达到中等或高于中等人类水平,从而完成中国象棋的对局任务。目前,该项目正积极开发中,尚未完成全部开发,欢迎大家通过pull request或star参与其中。受限于计算资源,无法在单一机器上完成如此庞大的任务,因此我专门编写了分布式训练代码。期望更多的小伙伴加入,一同努力训练这个中国象棋版的AlphaGo网络。我估计,当深度网络达到4000~5000elo分数时,将能够实现项目目标。目前深度网络已经接近1400分,离达到人类中上水平的目标并不远。由于计算资源的限制,我希望能够以较少的计算资源完成整个训练过程,因此不久前我引入了一些人类棋谱,也是elo曲线中出现跃升折线的原因。
暂无评论