2_dim_Q_learning_4x4.py

shellbeach 11 0 PY 2020-07-19 03:07:38

通过Q-learing算法设计的一个关于机器人走迷宫的python程序,''' 2*2的迷宫 --------------- | 入口| | 陷阱| | --------------- | ↓ | 陷阱 | 陷阱 | | --------------- | ↓ | 陷阱 | 陷阱 | | --------------- | → | → | → | 宝贝 | --------------- 每个格子是一个状态,此时都有上下左右停5个动作 任务:通过学习,找到一条通径

用户评论
请输入评论内容
评分:
暂无评论