文本分类语料库(复旦)测试语料
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。
用户评论
推荐下载
-
中文文本分类语料复旦训练集加测试集100M完整版
中文文本分类语料(复旦)训练集+测试集(100M)完整版
151 2020-01-24 -
香港城市大学语料库微软亚洲研究院语料库北京大学语料库
香港城市大学语料库(1 772 202 字,训练集)、微软亚洲研究院语料库(1 089 050 字,训练集)、北京大学语料库(1 833 177 字,训练集
13 2020-10-30 -
英文文本分类和聚类的语料
这是用于分类,聚类的英文文本语料20_newsgroups
33 2019-05-06 -
基于svm的中文文本自动分类系统的语料库
基于svm的中文文本自动分类系统的语料库
21 2019-02-22 -
情感分析语料库
关于酒店的评论,很好的情感分析语料,有4个不同的分类,每类超过2000篇
17 2020-05-15 -
垃圾邮件语料库
中国教育和研究计算机紧急响应垃圾邮件语料库
20 2020-05-18 -
学术文献语料库.zip
以论文摘要为主的20000+条语料,包含多个学科分类的内容,内容丰富,可做自然语言处理初学者日常学习之用。
36 2020-03-06 -
中文语料库.rar
语料库中文中文语料库复旦大学
57 2019-09-29 -
casia汉语情感语料库
可用于情绪语音识别,中文语料库
1300 2018-12-07 -
sogou中文语料库
相对比较完整的中文语料库,用于中文本分类的训练预料
78 2018-12-08
暂无评论