通过计划培训无人驾驶代理进行强化学习 项目摘要 该项目背后的主要动机是探索以自动驾驶为目的的强化学习的有效性。 另一个动机是在可预见的未来对自动驾驶汽车的需求不断增长。 主要目标是培训代理商在城市和高速公路上均执行自动驾驶,这将需要在两种类型的环境中培训代理商。 为了实现此目的,必须将模拟环境(如由提供的模拟环境)用于测试目的。 进行强化学习的方法有多种,一种用作单一代理,某些使用多种代理,目前的目标是仅使用一种代理,但通过进一步的研究,也许多种代理可能会产生更好的结果。 还有多种方法,一些方法仅使用强化学习,而另一些方法则结合使用计划和强化学习。 就目前的观点而言,结合强化倾斜的规划已显示出更有效的自动驾驶功能,但实施起来也更加复杂。 完整的项目提案: 进度更新 02/16/21 创建项目建议 02/21/21 探索探索了AirSim中的各种培训环境。 02/22/21 发