动手学深度学习Pytorch版Task04
用户评论
推荐下载
-
动手学深度学习中文版.pdf
《动手学深度学习》该书为官方中文版。由亚马逊首席科学家所著,手把手教你学会深度学习。作者是阿斯顿·张,李沐,[美]扎卡里·C.立顿,[德]亚历山大·J.斯莫拉。本书同时覆盖深度学习的方法和实践,不仅从
41 2019-07-10 -
动手学深度学习Pytorch版Task3过拟合欠拟合及其解决方案梯度消失梯度爆炸
过拟合、欠拟合 训练/泛化误差 训练误差(training error)和泛化误差(generalization error)。通俗来讲,前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试
14 2021-01-17 -
DATAWHALE动手学深度学习PyTorch笔记记录2attention mask
【Attention中mask pad的weight的做法】 在attention中,对attention score进行softmax时,需要考虑到query与pad计算得到的score应该忽略。我
11 2021-01-10 -
动手学深度学习学习笔记四
本文的主要内容有:机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer。 一、机器翻译及相关技术 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问
20 2021-01-15 -
动手学深度学习学习笔记五
本文的主要内容有::卷积神经网络基础;leNet;卷积神经网络进阶 一、卷积神经网络基础 本节我们介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充、步幅、输入通道和输出通道的含义。 二维卷
27 2021-01-17 -
笔记2动手学深度学习
资料来源:伯禹学习平台。 概念整理 K折交叉验证 由于验证数据集不参与模型训练,当训练数据不够用时,预留大量的验证数据显得太奢侈。一种改善的方法是K折交叉验证(K-fold cross-validat
23 2021-01-17 -
Datawhale动手学深度学习二
动手学深度学习(二)Day 3过拟合&欠拟合及其解决方案一些概念高维线性回归实验从零开始的实现丢弃法梯度消失&梯度爆炸一些理论Kaggle房价预测实战循环神经网络进阶代码实现Day 4
18 2021-01-30 -
动手学深度学习笔记2
第二次打卡内容 Task1 过拟合欠拟合,梯度消失,爆炸,LSTM,GRU Tsak2 机器翻译,Seq2Seq, Transformer Task3 卷积神经网络基础和进阶,leNet 过拟合与欠拟
22 2021-02-01 -
动手学深度学习笔记2
模型过拟合与欠拟合 首先我们需要区分训练误差和泛化误差。一般来讲,前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。计算训
18 2021-02-01 -
记录动手学深度学习05
文章目录6.6 通过时间反向传播6.6.1 定义模型6.6.2 模型计算图6.6.3 方法6.7 门控循环单元(GRU) 6.6 通过时间反向传播 6.6.1 定义模型 6.6.2 模型计算图 重点:
5 2021-01-31
暂无评论