参考资料,https://zhuanlan.zhihu.com/p/32089487,本实现参考借鉴了该资源,本实现的立体四子棋为落子无限制版的立体四子棋(qubic),落子有限制版的立体四子棋必须先下下层的棋子,上层的相关棋子才能继续落子,经过将近4700次的训练,ai水平已经不错了,模型为best_policy.model,python human_play.py即可对战。训练使用python train.py, 如果从0开始训练,请将train.py里的最后部分不加载模型