基于模型的强化学习的博弈论框架

qq_45867 17 0 PDF 2020-06-17 14:06:09

基于模型的强化学习(MBRL)最近获得了极大的兴趣,因为它具有潜在的样本效率和合并非策略数据的能力。然而,使用富函数逼近器设计稳定、高效的MBRL算法仍然具有挑战性。

基于模型的强化学习的博弈论框架

用户评论
请输入评论内容
评分:
暂无评论