ContinuousControl DeepReinforcementLearning:深度强化学习纳米级的第二个项目源码

qqthan59330 11 0 ZIP 2021-02-21 12:02:41

深度强化学习纳米学位-项目2:持续控制在这种环境下,双臂可以移动到目标位置。对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。动作向量中的每个条目都应为-1和1之间的数字。该任务是情节性的,并且为了解决环境,您的代理必须在100个连续情节中获得+30的平均得分。开始克隆此仓库。通过下一个链接设置python环境: 将p2_continuous-control/文件夹的

文件列表

ContinuousControl-DeepReinforcementLearning-main.zip (预估有个8文件)

ContinuousControl-DeepReinforcementLearning-main

Continuous_Control.ipynb 107KB

score.png 25KB

critic_checkpoint.pth 166KB

README.md 5KB

robots.gif 3.98MB

unity-environment.log 23B

actor_checkpoint.pth 165KB

Report.md 3KB

用户评论

暂无评论

深度学习之强化学习

强化学习(reinforcement learning)，又称再励学习、评价学习，是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用。但在传统的机器学习分类中没有提到过强化学习，而

61 2019-01-12
强化学习二

对于强化学习更深一层次的介绍

14 2020-10-14
DRLND project2Udacity的深度强化学习纳米学位项目2的实施源码

DRLND-project-2 该存储库包含项目2的实现。项目详情到达者该项目实现了PPO,用于解决Unity环境中的连续控制问题-使机械臂跟随旋转的航点-在具有20个代理的变体版本上。最终执

11 2021-03-02
DRLND project3Udacity的深度强化学习纳米学位项目3的实施源码

DRLND-项目3 该存储库包含项目3的实现。项目详情该项目实施了多代理深度确定性策略梯度(MADDPG),用于解决在虚拟世界中打网球主要是合作游戏的Unity环境。最终执行记录: 在这种环境下

11 2021-02-21
强化学习在60天内学习深度强化学习Python讲座和代码强化学习加深度学习源码

深度强化学习课程探索神经网络和强化学习的结合。 Python和PyTorch中的算法和示例您是否听说过和的取得了惊人的结果? 这都是关于深度神经网络和强化学习的。您是否想了解更多? 这是您最终学

51 2021-02-16
DeepReinforcementLearning DDPGfor RoboticsControl这是名为深度确定性策略梯度DDPG的深度强化学习算法的

DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,用于训练4自由度机械臂以达到移动目标。动作空间是连续的,学习的代理会输出扭矩以使机器人移

31 2021-02-27
崇志宏强化学习和深度强化学习

深度学习在强化学习方面的应用所产生的深度强化学习取得快速发展。如何解释深度强化学习优势产生的原因是理解技术的基本方法。

72 2018-12-29
Trivia API我在Misk Udactiy的第二个项目全栈开发人员纳米学位计划源码

全栈API最终项目全栈琐事 Udacity已投入资金为其员工和学生创造联系体验。一群团队成员想到了定期举行琐事的想法,并创建了一个网页来管理琐事应用和玩游戏,但是他们的API经验有限,仍然需要构建

8 2021-02-27
论文研究西北印度洋的第二个夏天

两个独立的SST地图集已经确认，印度洋西北部的表层存在一个双季节信号。80F等温线所包围的区域从1月增加到5月的最大值，然后减少（降温）到8月，最近对此进行了解释。然后在10月/11月有第二个最大的温

12 2020-06-14
WF工作流的第二个完整例子rar

我相信对于初学WWF工作流的人会有一定的帮助，一个不错的例子

19 2019-01-12

ContinuousControl DeepReinforcementLearning:深度强化学习纳米级的第二个项目 源码

文件列表

用户评论

推荐下载

ContinuousControl DeepReinforcementLearning:深度强化学习纳米级的第二个项目源码