1.机器翻译和数据集 1.1机器翻译 定义:将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT) 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。 基本结构:Encoder-Decoder encoder:输入到隐藏状态 decoder:隐藏状态到输出 通常应用在对话系统、生成式任务中 Encoder Decoder EncoderDecoder 1.2模型逻辑 import sys sys.path.append('/home/kesci/input/d2l9528/') import collections imp