人民日报语料
PFR语料库是对人民日报1998年上半年的纯文本语料进行了词语切分和词性标注制作而成的,严格按照人民日报的日期、版序、文章顺序编排的。文章中的每个词语都带有词性标记。
用户评论
推荐下载
-
文本分类语料库复旦测试语料
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料
34 2020-04-20 -
中文语料数据
中文语料数据
53 2018-12-07 -
AntConc语料检索
AntConc语料检索
14 2020-05-05 -
哈工大语料
哈尔冰工业大学语料,需要的下载,HIT-CDTB-1.0
59 2019-02-15 -
python语料收集
使用前微信关注小冰,与腾讯智能闲聊互问,用于收集生成式训练语料,语料质量还行吧
27 2019-03-14 -
新闻分类语料
新闻分类语料,9个类别财经,教育,军事,科技,政治等按新闻标签爬取的。
44 2019-05-17 -
分词训练语料
用于深度学习NLP分词训练,训练模式BEMS,已经标注好,可直接使用
30 2019-05-21 -
泰语的语料
用于分词、句法分析的泰语语料,主要适用于自然语言处理的学习之用!
22 2019-04-16 -
python语料爬虫
做自然语言处理时需要语料来做训练集,利用这个爬虫程序可以很方便的获取语料。
36 2019-05-16 -
中英平行语料
UNparallelcorpus.15,886,041linescasia2015:1,050,000linescasict2015:2,036,833linesdatum2015:1,000,003
26 2019-07-08
暂无评论