人民日报2014语料库是一个基于分词之后词性标注过的语料库,是一个针对词性标注训练的语料库,语料库含有相应的词性标注。本文件保留原本分词痕迹,但删除了文本的词性标注,并把所有文件夹语料整合到一个文本文件里使其更适合进行NLP分词训练。