BIDAF基线模型 基线系统实现 数据集分析 数据集是DuReader,特点是一个问题对应着多篇文章,我们要从多篇文章中抽取出正确的答案。 一条训练数据样式如下: 预处理 这里使用的是训练好的sgns.wiki.word的词向量 下载地址为sgns.wiki.word 也可以建立词表,随机初始化词向量 def prepare(args): """ checks data, creates the directories, prepare the vocabulary and embeddings 检查数据,创建目录,准备词汇表和嵌入 """ logge