# 中文分词语料
汉语分词语料库
CTB6汉语分词语料库,可以拿来做分词任务。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
搜狗分类分词语料库
里面是2015年搜狗新闻,根据12大学科分类的中文分词资源,包含1127万字。
msra实体识别与分词语料
msra语料包括实体识别(NER)和分词(seg)已标注数据,包括已标注的训练集和测试集,实体识别采用BIO标注,分词采用BM1
人民日报中文分词语料库
采用人民日报标准语料库 中文分词可以用到,或做其他中文学术研究
人民日报中文分词语料库
网上流传的人民日报1998年1月份的语料库,北京大学开发;处理成了crf分词训练语料的格式;
人民日报中文分词语料库
网上流传的人民日报1998年1月份的语料库,北京大学开发;处理成了crf分词训练语料的格式;
人民日报语料库中文分词语料库
人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料
分词语料_人民日报_201401
该资源为2014年1月分词及标注语料。如果谁有全年切分语料希望能共享出来。
icwb2_data等分词语料
分词相关训练语料数据icwb2-dataicwb2-dataicwb2-data
人民日报中文分词语料库.zip
人民日报中文分词语料库