Attention层能够为不同任务定义不同的注意力分数计算方法,本文分享了手动实现Attention层的方法,包括计算注意力权重、加权平均等步骤。同时提供了一些常见的应用场景和注意事项。