pytorch组队学习

_梧桐雨 12 0 PDF 2021-01-31 02:01:19

卷积神经网络基础 本节介绍循环神经网络,下图展示了如何基于循环神经网络实现语言模型。我们的目的是基于当前的输入与过去的输入序列,预测序列的下一个字符。循环神经网络引入一个隐藏变量H,用Ht表示H在时间步t的值。Ht的计算基于Xt和Ht−1,可以认为Ht记录了到当前字符为止的序列信息,利用Ht对序列的下一个字符进行预测。 循环神经网络的构造 我们先看循环神经网络的具体构造。假设 Xt∈Rn×d 是时间步 t 的小批量输入, Ht∈Rn×h 是该时间步的隐藏变量,则: Ht=φ(XtWxh+Ht−1Whh+bh). 其中, Wxh∈Rd×h , Whh∈Rh×h , bh∈R1×h , φ 函数是

用户评论
请输入评论内容
评分:
暂无评论