第二次打卡内容(2月15日-18日) Task03:过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶(1天) Task04:机器翻译及相关技术;注意力机制与Seq2seq模型;Tran
优化与深度学习 优化与估计 尽管优化方法可以最小化深度学习中的损失函数值,但本质上优化方法达到的目标与深度学习的目标并不相同。 优化方法目标:训练集损失函数值 深度学习目标:测试集损失函数值(泛化性)
Task03 1.过拟合欠拟合及其解决方案 训练误差(training error):模型在训练数据集上表现出的误差。 泛化误差(generalization error):模型在任意一个测试数据样本
《动手学深度学习》学习网址: 《动手学》:过拟合、欠拟合及其解决方案 1. 关于验证数据集的描述错误的是: 答案:测试数据集可以用来调整模型参数。 解析:测试数据集不可以用来调整模型参数,如果使用测试
1.卷积神经网络基础; 对于CNN中一些概念的理解 1.feature map 在CNN的各个卷积层中,数据都是以3维形式存在的。我们可以把它看成许多个2维平面图叠在一起,其中每个2维图称为一个fea
一 机器翻译及相关技术 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能
过拟合、欠拟合及其解决方案 模型选择、过拟合和欠拟合 训练误差和泛化误差 在解释上述现象之前,我们需要区分训练误差(training error)和泛化误差(generalization error)
一 过拟合、欠拟合及其解决方案 欠拟合(underfitting): 一类是模型无法得到较低的训练误差,我们将这一现象称作 过拟合(overfitting):模型的训练误差远小于它在测试数据集上的误差
1.过拟合、欠拟合及其解决方案 模型训练中经常出现的两类典型问题: 1.模型无法得到较低的训练误差,我们将这一现象称作欠拟合(underfitting); 2.模型的训练误差远小于它在测试数据集上的误
一、深度学习中的一些常见问题及解决方案 (1)欠拟合 欠拟合即模型无法得到较低的训练误差,导致欠拟合的主要原因是模型复杂度不够,特征维度过少,导致拟合的函数无法满足训练集,误差较大。 (2)过拟合 过