RND 阿什温源码

qqdistinction90870 16 0 ZIP 2021-02-21 02:02:07

奖励学习rl 该存储库是以下论文的正式实现: 无需奖励工程的端到端机器人强化学习艾维·辛格(Avi Singh),拉里·杨(Larry Yang),克里斯蒂安·哈蒂卡宁(Kristian Hartikainen),切尔西·芬恩(Chelsea Finn),谢尔盖·莱文(Sergey Levine) 2019 | | 视觉悬垂视觉推送视觉书架可视开门视觉推杆视觉选择器我们提出了一种使用深度强化学习对现实世界中的机器人技能进行端到端学习的方法。我们直接在像素观察中学习这些策略,而无需任何人工设计或特定于任务的奖励功能,而是从少数用户提供的目标示例(大约80个)中学习了此类任

文件列表

RND-阿什温 (预估有个245文件)

.dockerignore 210B

Dockerfile.softlearning.base.gpu 6KB

Dockerfile.softlearning.base.cpu 4KB

.env 131B

collect_lift_goals.ipynb 755KB

collect_pusher_goals.ipynb 50KB

experiment_logger.ipynb 563KB

aggregate_checkpoint_data.ipynb 167KB

examine_hw_run.ipynb 5.18MB

vae_latent_space_visualization.ipynb 2.35MB

regressing_onto_vae_outputs.ipynb 2.4MB

vae_sanity_checks.ipynb 655KB

train_embedding.ipynb 599KB

ground_truth_embedding.ipynb 1.8MB

compare_algs.ipynb 228KB

vice_reward_visualizations.ipynb 16.01MB

vice_reward_visualizations-Copy1.ipynb 16.01MB

ddl.ipynb 85KB

.gitignore 1KB

free_screw_multigoal_collection.ipynb 39KB

用户评论

暂无评论

芭比阿罗源码

JavaScript界面的创建:JavaScript和Orientação的交互,以及平台的Alura

8 2021-02-21
阿兹卡尔源码

阿兹卡尔一个新的Flutter项目。入门该项目是Flutter应用程序的起点。如果这是您的第一个Flutter项目,那么有一些资源可以帮助您入门: 要获得Flutter入门方面的帮助,请查看我

26 2021-02-21
阿希拉源码

阿希拉

8 2021-02-23
阿普萨源码

TinyMCE TinyMCE是世界上最受欢迎的基于Web的开源WYSIWYG编辑器。受数百万开发人员的信任和喜爱,并集成到成千上万的应用程序中,例如: 内容管理系统(CMS) 学习管理系统(LMS

22 2021-02-23
阿特randint源码

阿特randint

8 2021-02-23
阿齐拉丹源码

:waving_hand: 马曼,你好! 我是Aziz Ramdan Kurniawan。 :hourglass_not_done: 我的统计 :chart_increasing: 我最常使用的语言

6 2021-02-23
阿维托源码

贸易营销的后端后端。 Осервисе НаписаннаPython / Flask,можноподнятьчерездокер。 Установкаизапуск $ docker-compos

19 2021-02-23
阿康族源码

画Na 简单的WhatsApp机器人对于TERMUX用户 > pkg update && pkg upgrade > pkg install git -y > pk

4 2021-02-22
阿萨德源码

情人节 ASAD最初是在朋友之间的一封简陋的电子邮件链上,每天向我们发送一首歌来聆听和讨论。自成立以来,我们已浏览了600多首歌曲,其成员数量已发展到数十个。临近年底时,我们所有人都开始查看当年发

20 2021-02-23
阿祖勒源码

阿祖勒

15 2021-02-23

RND 阿什温 源码

文件列表

用户评论

推荐下载

RND 阿什温源码