这是Q-learning算法的一个计算Q值表格的小代码,可以看出Q-table是如何更新的。