暂无评论
过拟合、欠拟合及其解决方案 过拟合和欠拟合 一类是模型无法得到较低的训练误差,我们将这一现象称作欠拟合(underfitting); 另一类是模型的训练误差远小于它在测试数据集上的误差,我们称该现象为
house price 学习记录。 %matplotlib inline import torch import torch.nn as nn import numpy as np import pa
这是最新的一期深度学习内部资料,里面涉及到BP神经网络、CNN、RNN以及优化算法、如何调参等。适合零基础和有一些基础像加深对BP神经网络理解的初学者
有效长度 def SequenceMask(X, X_len,value=0): maxlen = X.size(1) mask = torch.arange(maxlen)[None, :].to(
疑问及思考:对于梯度爆炸与梯度消失的影响理解还不透彻,只知道多层神经网络后梯度可能趋于非常大或者接近0 的值, 但实际上呢?例如权重裁剪,可以解决爆炸的问题吗?会不会反而带来了梯度消失的问题?这种是不
以下涉及课程视频、教程及官方文档、Github代码、课程目录、学习论坛等部分 全部10节课程视频:https://space.bilibili.com/209599371#!/channel/deta
动手学深度学习-李沐2018年11月,想看的可以下载看一下
1 简介 11.1 深度学习简介。....................................11.2 如何用书。....................................4
机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer 2.15-2.19 一、机器翻译及相关技术 定义: 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解
一、欠拟合与过拟合 误差: 训练误差(training error):指模型在训练数据集上表现出的误差 泛化误差(generalization error):指模型在任意一个测试数据样本上表现出的误差
暂无评论