udacity_deep_reinforcement_learning_project2 源码
总览 该存储库包含我为Udacity的纳米计划“深度强化学习”于2020年末开始的“ Project 2”提交内容。 它提供了解决“ Reacher”环境的学习代理的实现: 项目详情 在“ Reacher”环境中,代理是一个双臂,试图将目标尽可能长时间地定位在目标位置。 状态空间有33个维度,其中包含手臂的位置,旋转,速度和角速度。 利用此状态信息,代理必须通过选择手臂关节的动作来最大化总回报。 在每个时间步长,这四个可用动作对应于与代理手臂的两个关节相关的扭矩。 每个转矩作用与[-1,1]范围内的值相关。 该任务是情节性的,这意味着它具有清晰的开始和结束,并且在每个情节开始时都会重置所有
文件列表
udacity_deep_reinforcement_learning_project2-main.zip
(预估有个11文件)
udacity_deep_reinforcement_learning_project2-main
Report.ipynb
95KB
LICENSE
34KB
weights_learned
checkpoint_actor.pth
589KB
scores_test.pkl
2KB
scores_train.pkl
12KB
checkpoint_critic.pth
590KB
udacity
__init__.py
0B
用户评论