中文自然语言处理中文分词训练语料

Yz218_38 72 0 ZIP 2018-12-09 06:12:52

本次提供的中文汉语语料syj_trainCorpus_utf8.txt全网免费,转载需要注明出处,语料是作者通过爬取的短文本和网络上的预料处理、合并生成的。整个语料大小264M,包含1116903条数据,数据用空格隔开,可以用来训练分词模型。

用户评论
请输入评论内容
评分:
Generic placeholder image 卡了网匿名网友 2018-12-09 06:12:52

挺好的语料

Generic placeholder image 卡了网匿名网友 2018-12-09 06:12:52

非常不错的语料