一、机器翻译及相关技术; 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。( 例:i am chinese=我是中国人,长度变化:3—>5) 数据预处理: 将数据集清洗、转化为神经网络的输入minbatch 分词: 字符串—>单词组成的列表 建立词典: 单词组成的列表—>单词id组成的列表 载入数据集: Encoder-Decoder: 解决“i am chinese=我是中国人”问题 encoder:输入到隐藏状态 decoder:隐藏状态到输出