Ta上传的资源 (0)

facebook 在机器的 VizDoom 比赛中得到了第一名,其中涉及到了强化学习在sparse reward的环境中使用Reward Shaping和Curriculum Learning的技巧。