复旦大学中文文本分类数据集
本语料库由复旦大学李荣陆提供。train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。下载后可以自己重新切分数据,也可以直接用。免费下载地址:链接:https://pan.baidu.com/s/1E2vUjyBtrlG0SBCkO-_IAQ密码:dq9m使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
用户评论
推荐下载
-
复旦大学的数据库课件
宫教授的数据库课程所使用的课件.PPT形式。希望对大家学习有所帮助
25 2019-07-06 -
复旦大学数据库学习课件
复旦大学数据库课件非常全面第一章计算机与信息技术
19 2019-06-05 -
基于改进KNN算法的中文文本分类方法
介绍了中心向量算法和KNN算法两种分类方法。针对KNN分类方法在计算文本相似度时存在的不足,提出了改进方案。新方案引入了中心向量分类法的思想。通过实验,对改进的KNN算法、中心向量算法和传统的KNN算
7 2020-11-22 -
Bagging算法在中文文本分类中的应用
Bagging算法在中文文本分类中的应用
34 2019-01-17 -
使用最大熵模型进行中文文本分类
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技末1由于最大嫡模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结来.但是,将最大嫡模型应用在文本分类中的研
29 2019-05-05 -
2008最新搜狗中文文本分类语料最新最全
很全的中文文本分类语料库可以用于文本分类文本聚类C000007汽车C000008财经C000010ITC000013健康C000014体育C000016旅游C000020教育C000022招聘C000
35 2019-05-02 -
利用支持向量机实现中文文本分类.zip
利用支持向量机实现中文文本分类.zip
3 2023-01-26 -
NLP小白入门超全中文文本分类系统含训练及测试数据集
NLP小白入门——超全中文文本分类系统(train set & test set + stop word*4 + word2vec + TF-IDF + Naive Bayes)
305 2018-12-09 -
粗糙集文本分类代码
文本分类代码
35 2019-06-05 -
中文文档分类数据集清华大学数据挖掘实践
这里提供了一个中文文档分类数据集,可用于机器学习和数据挖掘方面的实践。该数据集包含4种类型的文档:女性、体育、文学和校园。训练集和测试集分别存储在train和test文件夹中,同时也提供了已处理好的停
16 2023-04-20
暂无评论