推荐下载
-
基于SVM的中文文本分类系统的设计与实现
互联网已经成为现代生活中不可或缺的一部分,网络上的信息量也在以数倍的速度快速增长。无论是企事业单位,学校,或者科研院校等等机构中,都积累了非常多的资料,这些资料绝大多数都以文档的形式存在。所以,如何将
6 2021-02-01 -
复旦大学中文文本分类数据集训练加测试
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少
28 2020-03-06 -
基于向量空间模型的中文文本分类技术研究
0引言伴随着文本挖掘技术的发展,文本分词技术作为文本挖掘技术的一个重要研究分支,也得到了迅速的发展.文本分词技术为大多数文本挖掘技术(如文本分类技术,文本聚类技术等)提供文本预处理工作,分词效果的好坏
22 2019-09-20 -
基于ELMo词向量的textCNN中文文本分类python代码
基于ELMo词向量的textCNN中文文本分类python代码,ELMo是基于哈工大的HIT-SCIR/ELMoForManyLangs,文本分类代码是基于keras的,有数据有模型有代码。
14 2020-07-16 -
中文文本分类中特征抽取方法的比较研究.pdf
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI四种不同的特征选取方法。采用支持向量机(SVM)和KNN两种不同的分类器以考察不
39 2019-05-14 -
研究论文基于特征项扩展的中文文本分类方法
提出了一种基于特征项扩展的中文文本分类方法.该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能
10 2020-08-11 -
复旦大学中文文本分类训练集和测试集
复旦大学中文文本分类训练集和测试集,all文件夹为复旦大学中文文本分类语料集,test_corpus为该语料集中挑选部分划分出来的,train_corpus为该语料集中挑选test_corpus后剩余
76 2019-05-13 -
中文文本分类中特征选择方法的研究与实现
这是一篇硕士论文,题目是《中文文本分类中特征选择方法的研究与实现》,不但有理论上的研究,更难的是有具体的实例,还给出了软件的界面,值得参考。
45 2018-12-15 -
复旦大学中文文本分类数据集_训练加测试
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少
692 2019-04-27 -
基于VSM的中文文本分类系统的设计与实现
论文介绍了基于VSM的中文文本分类系统的设计与实现
22 2019-09-20
用户评论