动手深度学习(Pytorch)之路—第二次打卡

machao79339 14 0 PDF 2021-02-01 07:02:48

引言 今天分享的内容有:首先聊聊深度学习中存在的过拟合、欠拟合现象,以及梯度消失、梯度爆炸等。其次,分享一个本人梳理的卷积神经网络、循环神经网络代码结构。 过拟合、欠拟合 模型的泛化能力是深度学习的一大问题,所谓泛化能力就是模型在训练数据集和测试数据集上的表现情况。泛化能力强的模型,在训练数据集和测试数据集上都具有良好的表现;泛化能力差的模型,往往在训练集上表现良好(或在训练数据集上表现也很差),同时,在测试数据集上的表现也同样差强人意。若泛化能力的模型主要分为两类:(1)如果在训练集表现差,在测试集表现同样很差,这可能是欠拟合导致;(2)如果模型在训练集表现非常好,在测试集上表现很差,则这便

用户评论
请输入评论内容
评分:
暂无评论