简要地评论了强化学习的历史、现状与未来的发展途径,认为强化学习应从先行后知、先知后行向知行合一的平行强化学习迈进,实现在虚拟世界“吃一堑”,在物理世界“长一智”,真正成为智慧机制和智能算法的基础学习理论。