执行安全高效的车道变更是创建全自动驾驶汽车的关键功能。最近的先进技术已经证明了使用深度强化学习的成功车道跟随行为,但很少考虑与其他车辆在道路上进行交互以改变车道的行为。本文设计了一种分层的深度强化学习(DRL)算法来学习密集交通中的车道变化行为。通过将整体行为分解为子策略,可以了解更快,更安全的车道变更动作。我们还将时空注意应用于DRL架构,这有助于车辆将更多的注意力集中在周围的车辆上,并导致更平滑的车道变换行为。我们在TORCS模拟器中进行实验,其结果在各种车道变更场景中均优于最新的深度强化学习算法。1)提出一种分层的深度强化学习算法,该算法可以学习道路上的变道行为。我们的方法可以轻松扩展为