用于词嵌入训练的语料集,同于word2vec_word_emboding