分词数据集,用于训练一个用来分词的模型。详细看压缩包里的内容。