Ta上传的资源 (0)

模仿学习经常被用在机器人学,这种方法经常遭受数据的错配和组合的错误。 DAgger是一种迭代的算法,解释了聚合的训练数据集中来自专家的和初学者的策略的问题,但是没有考虑到安全性的影响。该方法对DAgger进行了概率性的延伸,尝试量化初学者策略的自信度来作为一种安全性的代理。通过EnsembleDAg

One-ShotImitationLearningarXiv:1703.07326v3[cs.AI]4Dec2017YanDuan,MarcinAndrychowicz,BradlyStadie,JonathanHo,JonasSchneider,IlyaSutskever,PieterAbbeel

冰点文库,可以下载百度文库,豆丁,道客巴巴,电器天下,IT168,lbalib,open-open,金字塔医学,大桔灯,max.book188