本节课内容批量归一化和残差网络、凸优化、梯度下降 一、批量归一化和残差网络 1.批量归一化 对输入的标准化(浅层模型):处理后的任意一个特征在数据集中所有样本上的均值为0、标准差为1。标准化处理输入数据使各个特征的分布相近。 批量归一化(深度模型):利用小批量上的均值和标准差,不断调整神经网络中间输出,从而使整个神经网络在各层的中间输出的数值更稳定。 对全连接层做批量归一化 位置:全连接层中的仿射变换和激活函数之间。 对卷积层做批量归一化 位置:卷积计算之后、应用激活函数之前。 如果卷积计算输出多个通道,我们需要对这些通道的输出分别做批量归一化,且每个通道都拥有独立的拉伸和偏移参数。 计算