搜狗分类分词语料库
里面是2015年搜狗新闻,根据12大学科分类的中文分词资源,包含1127万字。
用户评论
推荐下载
-
语料库标注工具SUTDAnnotator
语料库标注工具SUTDAnnotator,研究自然语言处理的同学推荐使用。
41 2019-05-14 -
汉语语料库加工规范
《现代汉语语料库加工规范——词语切分与词性标注》词性标记
42 2019-07-28 -
酒店领域评语语料库
用于情感分析案例的语料库,亲测有效。积极、消极各5000条数据。
23 2019-07-10 -
TFIDF java实现语料库
TFIDF java实现 可运行多文件语料库 亲测可行 语料库为《人民日报》相关权威新闻
34 2018-12-17 -
reuters21578语料库
reuters21578语料库,是文本挖掘必备的语料库。本人专业为文本挖掘,欢迎同行交流分享经验。
19 2019-07-24 -
中英平行语料库.zip
中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
36 2019-09-09 -
Reuters21578语料库
这是本人在做自然语言处理使用到的一个语料库,后期也会同步与大家共享资源
19 2019-01-06 -
wiki中文语料库
维基中文语料库,大小1.6G,所以上传到百度云,之前在csdn找了很久都没找到,只好自己翻墙去下载
50 2019-01-09 -
基于后缀数组分词不需要词典和语料库
基于后缀数组的分词,是不需要词典和语料库。通过后缀数组和散列表获得汉字结合模式。
22 2018-12-28 -
机器学习文本分类语料库训练集已标签分类
文本分类语料库训练集,供学习测试使用。新闻类语料(已标签分类),包含经济、交通、教育、环境、体育、医药等类目共上千份新闻文本。
56 2019-05-15
暂无评论