在3x3的棋盘上,两位选手轮流下棋,目标是让自己的棋子在横、竖或斜线上排列成三个。游戏以胜利、平局或失败结束。系统使用强化学习方法训练两个电脑选手,然后玩家可以与机器对战。