game_human.py是游戏的人类可玩版本。 play_step()不采取任何措施,其操作类似于旧格式(可在store/game.py找到)的更新功能。 在这种情况下, play_step()返回一个game_over变量。 game_ai.py是游戏的AI版本,其中将给play_step(action)函数一个动作。 它返回奖励,game_over和得分。 操作采用以下格式:[模式| 车站| 铁路]。 例如: MODE = [1 0 0] STATIONS = [1 1 0 0 0 0 0 0] RAILS = [1 0 0] 这意味着:使用第一根导轨连接第一站和第二站。 agent.py针对GAME_COUNT个游戏数量运行培训过程。 此类中最重要的函数是get_state()和get_action(state)函数。 可以从plots/*找到开始训练过程的plots/*