该文档为AI学习中强化学习的TRPO算法论文,PDF格式的内容。