Transformer部分的学习code注意力机制.