基于因果图的FMDP问题的任务层次图的动态优化方法,周建才,王红兵,分层强化学习(HierarchicalReinforcementLearning,HRL)是解决强化学习维数灾难问题的一种重要方法。分层强化学习的一个重要问题是任务的��