谷歌2019年11月最新论文,推出Muzero算法,能够实现智能体的无模型的强化学习。MuZero相比AlphaZero的优势是更具有通用性。