推荐下载
-
小黄鸡语料库分词以及未分词
小黄鸡语料库,包含分词以及未分词,可以用于自然语言处理。
71 2019-03-30 -
中文分词字典整理242764个词语
中文分词字典,整理242764个词语,由网上众多辞典拼合并过滤重复词语而来,需要的朋友可以下载去看看。
59 2018-12-26 -
搜狗语料库已分词
搜狗语料库,自己用结巴分词分好的。(为什么摘要必须大于50个字)
505 2018-12-08 -
中文分词及词性标注语料
中文分词及词性标注语料,包含微软亚研院、搜狗、北京大学等的语料库
49 2019-04-28 -
中文分词词典_54w条词语
中文分词词典适合最大正向匹配算法使用共计548389条词语
29 2019-06-04 -
分词库和语料库.zip
人民日报2014语料库和很多行业的中文分词库,如财经,地点,电视剧,电影等。如果有需要的可以在此处下载哦。
23 2020-05-19 -
小黄鸡_未分词_语料库
来源于人人网小黄鸡语料库,经过一部分处理后,但是并没有分词,可以用于对于中文的常用对话系统训练,也可以进行普通的中文自然语言处理。
60 2019-02-19 -
ChineseDiachronicCorpus ChineseDiachronicCorpus中文历时语料库跨越六十余年包括腾讯历时新闻20002016人民日
中国历时科普斯 ChineseDiachronicCorpus,中文历时语料库,跨越六十余年,包括腾讯历时新闻2009-2016,人民日报历时语料1946-2003,参考消息历时语料1957-2002
42 2021-04-06 -
维基百科中文语料已分词
自己用来训练word2vec的,已提取文本,做了分词处理,过滤了大部分的特殊字符。共包含3273626个段落的文本(一个段落包含了多个语句)。处理后的语料有1.1G,由于文件较大,提供百度网盘下载
13 2020-05-19 -
人明日报2014年crf标注语料整理文档
收集人明日报2014年标注预料并将其进行整合,非常实用
12 2020-05-17
用户评论