People pku1998.zip
该包是人民日报1998年1月-6月标注词性的完整语料,半年的,不是网上千篇一律的1月份的,该资料适用于NLP自然语言处理领域的 序列标注任务,如分词,命名实体识别、词性标注等。人民日报1998年标注语料是纯人工手动标注和校对的,比2014年标注语料准确率高很多;2014年的是没有校验的,会有很多偏差;建议以98年的这版来训练模型!本人已经对语料中的排版进行整理过,开箱即用;
文件列表
People-pku1998.zip
(预估有个6文件)
199806.txt
10.85MB
199805.txt
10.79MB
199801.txt
9.74MB
199802.txt
9.96MB
199803.txt
10.87MB
199804.txt
11.14MB
暂无评论