Ta上传的资源 (0)

本资料为学徒学习大牛的博士论文,该论文通过提供专家策略,利用逆强化学习的方式,快速学习到媲美专家策略的新策略。