本书重点研究基于强大的动态编程理论的强化学习算法。它给出了学习问题的相当全面的目录,描述了核心思想,注意到了大量最新的算法,然后讨论了它们的理论特性和局限性。