本文研究了深度逆动力学模型在机器人控制策略中的应用。通过在模拟中开发控制策略的方法,可以在现实世界中更安全、更实用地运行实验。特别是在从规划和优化、强化学习等领域获得的策略中,逆动力学模型可以对数据要求较高。然而,在模拟成功的策略在部署到真正机器人上时却往往不起作用。本文研究表明,即使控制的细节不合理,但模拟中遍历的状态序列对于现实世界来说仍然合理。在执行机器人控制过程中,我们计算基于仿真的控制策略会如何执行,然后根据深度逆动力学模型决定哪种现实世界动作最适合实现下一个状态。最后,本文还提出了一种数据收集方法,以学习深度逆动力学模型。实验结果表明,本文方法相比处理模拟与现实世界模型差异而开发的各种基线是有利的。