DRLND project 2:Udacity的深度强化学习纳米学位项目2的实施 源码
DRLND-project-2 该存储库包含项目2的实现。 项目详情 到达者 该项目实现了PPO,用于解决Unity环境中的连续控制问题-使机械臂跟随旋转的航点-在具有20个代理的变体版本上。 最终执行记录: 当手臂末端位于目标球体内/目标航路点的固定范围内时,每个代理随时间累积的奖励。 代理的目标是遵循路标。 对于每个代理,状态空间具有33个维度,而动作空间具有4个连续维度。 该任务是情节性的,当特工在100个连续情节中获得+30的平均分数时,该任务被认为已解决。 履带式 该项目的可选/额外/挑战部分是控制爬虫。 在面对正确方向和该方向的速度时,每个四脚实体尝试遵循目标目标时,每
文件列表
DRLND-project-2-master.zip
(预估有个14文件)
DRLND-project-2-master
.gitignore
127B
Continuous_Control.ipynb
7KB
ppo_agent.py
12KB
Crawler.ipynb
11KB
requirements.txt
160B
reacher_solved.gif
4.06MB
Report.ipynb
39KB
README.md
6KB
crawler_solved.gif
4.04MB
暂无评论