在gridworld环境下,如何使用Python实现Q-Learning算法,特别是关于参数调整方面的技巧。通过实验发现,简单的地图、少量的状态数以及合适的参数组合都能够使算法收敛得更快、效果更好。如果你正在研究Q-Learning算法或者想对该算法进行进一步学习,不妨来看看本文的详细介绍。
Python Q Learning算法在gridworld中的实现及参数调整技巧100011083
文件列表
基于 Python 在gridworld环境中实现Q-learning算法【100011083】
(预估有个255文件)
record_dqn.gif
310KB
record_ddqn.gif
296KB
record.gif
310KB
events.out.tfevents.1639671211.LAPTOP-NIRSSRC2
1.14MB
events.out.tfevents.1639662133.LAPTOP-NIRSSRC2
285KB
events.out.tfevents.1639645156.LAPTOP-NIRSSRC2
554KB
events.out.tfevents.1639664426.LAPTOP-NIRSSRC2
149KB
events.out.tfevents.1639655440.LAPTOP-NIRSSRC2
578KB
events.out.tfevents.1639652535.LAPTOP-NIRSSRC2
162KB
events.out.tfevents.1639674056.LAPTOP-NIRSSRC2
823KB
暂无评论