Sutton的ReinforcementLearning:AnIntroduction(SecondEdition)第一章TicTacToe例子的Qt程序,利用了基本的RL算法。