针对小型无人直升机精确动力学模型难以获取以及姿态控制易受未知外界风扰影响的问题,设计一种基于强化学习(reinforcement learning,RL)与super twisting相结合的非线性控制算法.利用直升机在线飞行数据,训练执行者-评价者(actor-critic,AC)网络以逼近系统建模不确定部分.为了抑制未知外界风扰,提高系统鲁棒性,同时补偿AC网络逼近误差,设计基于super twisting的鲁棒控制算法.进而,利用Lyapunov稳定性分析方法证明无人直升机姿态误差能在有限时间内收敛到零.最后对所提出的算法进行实验验证,实验结果表明,所提出算法具有良好的控制效果,对系统不