小白知识点 训练误差和泛化误差 训练误差:模型在训练数据集上表现出的误差 泛化误差:模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。 验证数据集、测试数据集和训练数据集三者的功能 训练集:模型训练的过程其实就是在求参数,我们通过训练集来分别对模型进行训练,学习到每一个模型中对应的最优的参数。 验证集:我们要考察不同结构的模型在数据上的优劣程度,而模型的结构是由其中的超参数决定的,所以我们引入验证集来对这些超参数进行选择,以求找到最优效果的超参数。 测试集:当前两步完成后,我们学习到了好的模型参数与超参数,模型结构由此定了下来,最后再引入一些数据来测试这个模型