中文文本分类语料库(复旦大学)训练与测试集

weixin_11019 23 0 zip 2020-03-06 23:03:17

中文文本分类语料（复旦大学）-训练集和测试集。测试语料共9833篇文档；训练语料共9804篇文档。使用时请注明来源（复旦大学计算机信息与技术系国际数据库中心自然语言处理小组）。

用户评论

暂无评论

python实现CNN中文文本分类

CNN中文文本挖掘文本分类python深度学习机器学习

65 2019-07-24
中文文本分类停用词词表

一个文本文件，包含中文停用词集合，对文本处理过程中，方便剔除停用词

22 2020-05-04
PythonCNNRNN中文文本分类基于tensorflow

本文是基于TensorFlow在中文数据集上的简化实现，使用了字符级CNN和RNN对中文文本进行分类，达到了较好的效果。

39 2019-09-26
中文文本分类技术的研究

文本分类技术是文本挖掘的核心，本文简单介绍了该研究热点的研究动态、定义并针对其系统结构给出了一个简要的概述，然后分析了文本分类处理过程中的关键技术，最后对依然存在的某些问题进行了展望。

17 2020-04-20
text classification cn中文文本分类实践基于搜狗新闻语料库采用传统机器学习方法以及预训练模型等方法源码

文字分类文本分类(文本分类)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,某些垃圾邮件识别,舆情分析,情感识别,新闻自

10 2021-02-16
svmcls文本分类程序含C源代码语料库完整版

svmcls 2.0文本自动分类器支持中文和英文文档，特征选择方式包括全局和按类别选取，概率估算方法支持基于文档（布尔）统计和基于词频统计，支持三种特征加权方式，特征评估函数包括信息增益、互信息、期望

41 2019-01-15
BERT中文文本分类pytorch此存储库包含用于文本分类的预训练BERT模型的PyTorch实现源码

PyTorch的BERT中文文本分类此存储库包含用于中文文本分类的预训练BERT模型的PyTorch实现。代码结构在项目的根目录,您将看到: ├── pybert | └── callback

41 2021-04-27
英语语料库LOB语料库

LOB语料库创建时间: 1970年代初创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学规模层级: 100万词次基本情况:研究当代英国英语,与美国英语对比,使用了TAG

163 2018-12-07
人民日报语料库中文语料199801_中文语料库

人民日报语料库，文本切词，词性备注，为什么要大于50个字节。。。

1049 2018-12-28
AIML语料库Alice Bot语料库中文加英文

AIML Corpus Alice Bot Corpus (Chinese + English)

166 2019-06-22

中文文本分类语料库(复旦大学)训练与测试集

用户评论

推荐下载