深度学习是机器学习的一个分支因其模型具有多层结构深度二字由此而来.与传统的机器学习算法如支持向量机决策树逻辑回归等相比深度网络更容易学习到数据的本质特征一般地深度模型的预测也更加准确初始权值过大会导致模型极易收敛到局部最小而过小的权值则意味着每一层的梯度过小用于训练具有很多隐层的网络结构是不切实际的.预训练能把权值限定在一个较合理的范围在一定程度上避免了模型收敛到局部最小并且具有合适大小的初始梯度能够使模型快速收敛.这里使用的数据集是从scikit learn官网下载的MNIST手写体一共7万个手写数字在该测试代码中简单的取其中的三分之二为训练集剩下的三分之一的测试集.具体代码可以看这里在该代码中简单的搭建了一个7层的模型结构其节点数分别为784400200100502510.因为一个手写体数字的像素为28x28所以输入节点数为784输出节点数为10关于右上图里的参数precision提取出的正确信息条数 提取出的信息条数   recall提取出的正确信息条数 样本中的信息条数  换句话说