p2_continuous control:Udacity深度强化学习NanoDegree 项目2 机械手臂控制源码

attractive_92061 5 0 ZIP 2021-04-25 05:04:53

项目2:连续控制介绍对于此项目,您将使用环境。 ![训练有素的经纪人] [image1] 在这种环境下,双臂可以移动到目标位置。对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。动作向量中的每个条目都应为-1和1之间的数字。分布式培训对于此项目,我们将为您提供两个单独的Unity环境版本: 第一个版本包含一个代理。第二个版本包含20个相同的代理,每个代理都有自己的环境副本。第二个版本对于 , 和类的算法很有用,这些算法使用同一代理的多个(非交互,并行)副本来分发收集经验的任务。解决环境请注意,您的项目提交仅需要解决环境的两个版本之一。选项1:解决第一个版

文件列表

p2_continuous-control-master.zip (预估有个10文件)

p2_continuous-control-master

Continuous_Control_20agents.ipynb 54KB

.ipynb_checkpoints

Continuous_Control_20agents-checkpoint.ipynb 54KB

checkpoint_actor.pth 166KB

.gitattributes 66B

checkpoint_critic.pth 166KB

unity-environment.log 23B

environment.yml 3KB

README.md 6KB

Udacity Reacher Project Report_v2.pdf 147KB

Model_in_Action_20agents.gif 1.26MB

用户评论

暂无评论

Python深度强化学习Nanodegree

深度强化学习Nanodegree

30 2019-09-04
udacity deep rl Udacity深度强化学习课程源码

udacity-deep-rl Udacity深度强化学习课程

14 2021-03-23
DRLND project2Udacity的深度强化学习纳米学位项目2的实施源码

DRLND-project-2 该存储库包含项目2的实现。项目详情到达者该项目实现了PPO,用于解决Unity环境中的连续控制问题-使机械臂跟随旋转的航点-在具有20个代理的变体版本上。最终执

11 2021-03-02
udacity reacher Udacity深度强化学习纳米学位课程的连续控制项目学生在其中训练Unity Reacher手臂源码

持续控制项目在Udacity深度强化学习纳米学位计划中,持续控制是学生自己建立的第二个主要项目。该项目将使用任何基于策略的技术来构建和训练代理,以控制Unity ML代理环境中的Reacher两关

12 2021-02-22
drl_p2_continuous control源码

drl_p2_continuous-control 该存储库的内容表示“ Udacity深度强化学习”课程的项目2。在此项目中,我们正在解决由控制双关节手臂的运动组成的触手环境。通过在此双关节臂上

7 2021-04-27
深度强化学习综述x2

深度强化学习综述（刘全等）深度强化学习综述：兼论计算机围棋的发展

20 2019-05-25
aws webapp Udacity Cloud DevOps Nanodegree的项目2源码

aws-webapp Udacity Cloud DevOps工程师纳米学位的项目2

8 2021-02-18
深度强化学习A2C算法实现

完整实现A2C算法，包括实现要点、模型构建、虚拟环境交互、模型训练、信息监控等，并亲测在googlecolab中运行

32 2020-05-28
udacity drlnd project3Collaboration and Competition深度强化学习纳米学位项目3源码

项目3:合作与竞争该存储库包含项目3的实现。项目详情待定入门 Python环境如果您在自己的环境中运行该项目,则需要安装一些软件包。的Python == 3.6 pytorch == 0.

13 2021-04-06
强化学习在60天内学习深度强化学习Python讲座和代码强化学习加深度学习源码

深度强化学习课程探索神经网络和强化学习的结合。 Python和PyTorch中的算法和示例您是否听说过和的取得了惊人的结果? 这都是关于深度神经网络和强化学习的。您是否想了解更多? 这是您最终学

51 2021-02-16

p2_continuous control:Udacity深度强化学习NanoDegree 项目2 机械手臂控制 源码

文件列表

用户评论

推荐下载

p2_continuous control:Udacity深度强化学习NanoDegree 项目2 机械手臂控制源码