基于 Q0学习算法的迷宫问题的应用 一 迷宫的设计 设计宗旨尽量使每一个状态只有惟一的一个路径能够通过终点此外 1 处做为起点 34 处做为终点 二 状态及相关矩阵的设定及初始化 可以看出此矩阵为一个 10*10 的矩阵根据矩阵开闭的情况根据文献 [1] 可得此迷宫的矩阵数学模型为 1 x 51 50 49 48 47 x 52 56 2 x x x x x 46 x 53 x 3 4 5 x 2