EnsembleDAgger A Bayesian Approach to Safe Imitation Learning.pdf

qq_98675135 18 0 PDF 2021-04-18 14:04:35

模仿学习经常被用在机器人学,这种方法经常遭受数据的错配和组合的错误。 DAgger是一种迭代的算法,解释了聚合的训练数据集中来自专家的和初学者的策略的问题,但是没有考虑到安全性的影响。该方法对DAgger进行了概率性的延伸,尝试量化初学者策略的自信度来作为一种安全性的代理。通过EnsembleDAgger近似集成神经网路的GP算法。用方差作为自信度,捕捉初学者的疑问度来计算决策准则,从而来决定什么时候初学者的行动是安全的。通过这种方法,目的是最大限度共享初学者的行动,控制其失败的概率。我们通过比较在摇摆震荡和MuJoCo的HalfCheetah的环境中其他的DAgger方差和经典的模仿学习,展示了其方法的安全性和学习能力。

资源预览

用户评论

暂无评论

Machine Learning A Bayesian and Optimization Perspective.pdf

MachineLearningABayesianandOptimizationPerspective.pdf

19 2020-05-15
A Tutorial on Learning with Bayesian Networks.pdf好书

ATutorialonLearningwithBayesianNetworks是学习BN的一本不错的书，可以看看

18 2019-09-28
Bayesian Methods for Machine Learning

Bayesian Methods for Machine Learning.pdf

44 2018-12-07
Bayesian Reasoning and Machine Learning

bayesian学派经典书籍，很好的大数据分析资料.........

28 2019-04-16
A Bayesian Approach to Sparse Model Selection in Statistical Shape Models∗.pdf

A Bayesian Approach to Sparse Model Selection in Statistical Shape Models∗.pdf

21 2020-07-19
最新模仿学习Imitation Learning进展报告

随着时空跟踪和传感数据的不断增长,现在人们可以在大范围内分析和建模细粒度行为。例如,收集每一场NBA篮球比赛的跟踪数据,包括球员、裁判和以25hz频率跟踪的球,以及带注释的比赛事件,如传球、投篮和犯规

7 2020-12-09
A Bayesian Network Based Approach for Risk Modeling

A Bayesian Network Based Approach for Risk Modeling to Aid in Development of Sustainable Biomass Sup

12 2021-04-18
S.J.Wright Optimization for machine learning.pdf

TheyearlyNeuralInformationProcessingSystems(NIPS)workshopsbringtogetherscientistswithbroadlyvaryingb

40 2019-09-03
机器学习数学基础The mathematics of machine learning.pdf

高清版，机器学习数学基础-Themathematicsofmachinelearning

82 2019-09-03
论文研究Sparse representation based on manifold learning.pdf

基于流形学习的稀疏表达算法，杨政，刘海风，作为一种启发于人类视觉系统的技术,最近稀疏编码受到越来越多的关注。稀疏编码的主要目的是基于基集合学习新的稀疏坐标,而基通常�

35 2019-09-05

EnsembleDAgger A Bayesian Approach to Safe Imitation Learning.pdf

资源预览

用户评论

推荐下载