介绍了transformer模型的结构组成以及各个结构之前的联系,并对其中涉及到的基础知识进行汇总,以此同时对数学模型进行了完整的推导。