一种基于深度强化学习的方法来解决网格路径规划问题。该方法利用深度神经网络进行价值估计,并采用Q-learning算法来指导路径规划。通过大量实验,我们发现该方法能够在处理复杂地图时取得很好的效果。