sklearn文本分类数据包20newsgroups20news19997
20newsgroups数据集有三个版本。第一个版本19997是原始的并没有修改过的版本。第二个版本bydate是按时间顺序分为训练(60%)和测试(40%)两部分数据集,不包含交叉文档和新闻组名(新闻组,路径,隶属于,日期)。第三个版本18828不包含交叉文档,只有来源和主题名。
用户评论
推荐下载
-
中文文本分类器
WordFeature 一个文本分类器 希望对大家有用
22 2020-09-12 -
文本分类训练集.rar
文本分类训练样本集,主要为新闻集,将近万余个样本,已完成标签分类,可用于文本分类模型训练,主要为源文本内容,下载后需要自行中文分词等预处理
23 2020-08-21 -
LIBSVM学习文本分类
NULL博文链接:https://luchi007.iteye.com/blog/2267674
29 2020-06-01 -
文本分类实验报告
本报告包括完整的文本分类处理过程,包括24万搜狗预料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。并用自编朴素贝叶斯以及sklear
12 2020-05-04 -
中文文本分类语料
文本分类语料库,包含医药、计算机、环境、经济、交通、艺术、体育等10个学科领域
26 2020-05-14 -
LSTM多类文本分类
LSTM多类文本分类,keras实现,Multi-ClassTextClassificationwithLSTM,bySusaNLi。
32 2019-09-20 -
文本分类特征选择方法
文本分类特征选择方法
37 2019-09-06 -
文本分类语料库
文本分类语料库,中文,训练集和测试集
55 2018-12-08 -
hatt文本分类python代码
文本分类python代码,google的多头attention,实现效果很好
42 2019-01-19 -
SVM实现文本分类代码
利用十大经典机器学习算法之一的SVM(支持向量机)算法,实现文本分类,用于自然语言处理。
29 2019-02-18
暂无评论