具有反向传播代码的前馈神经网络 使用的变量: X_train:形状(784,54000) X_test:形状(784,10000) X_val:形状(784,6000) y_train_org:原始y形火车(54000,1) y_val_org:形状为(6000,1)的原始y val y_train_one:一列形状为(10,54000)的高温y火车 y_val_one:形状为(10,6000)的一个热y val y_test:形状(10000,1) nn:神经元数 prev_n:上一层中的神经元数量 W:包含所有层的权重矩阵的列表 b:包含所有层的偏置矩阵的列表 a:包含所有层的激活向量的列表 h:包含所有层的预激活向量的列表 笔记 : W_gd,W_m ====>梯度下降和动量梯度下降优化器的权重矩阵。 这些变量的名称会根据优化程序的名称而相应地更改。 对于b,a和