处理好的人民日报语料,用于命名实体识别,两个文件分别为字符集和词语级