用于自然语言处理,作为语料库使用,可用于分词,词性标注