注意:此存储库将不再更新,并且已成为更大的存储库的一部分。 建议您使用PEDRA而不是此存储库。 通过迁移学习进行深度强化学习-模拟无人机和环境(DRLwithTL-Sim) 什么是DRLwithTL-Sim? 该存储库使用基于传输学习(TL)的方法来减少通过深度强化学习为目标算法性能训练深度神经网络进行自主导航所需的机载计算。 使用虚幻游戏引擎手动设计了3D现实元环境库,并且对网络进行了端到端的培训。 这些经过训练的元权重随后在模拟测试环境中用作网络的初始化程序,并针对最后几个完全连接的层进行微调。 无人机动力和环境特性的变化表明了该方法的鲁棒性。 可在@ 找到包含真实DJI Tello无