Python处理文本分类代码一
加载Gutenberg语料库; 过滤停用词; 构建词袋模型:一篇文档是有其中的词构成的一个集合(袋子); 词频分析:NLTK中的FreqDist类可以将单词封装成字典。 分类器部分代码见《Python处理文本分类代码(二) 》下载资源
用户评论
推荐下载
-
文本分类语料库
文本分类语料库,中文,训练集和测试集
55 2018-12-08 -
Scikit_learn文本分类
包含4部分数据下载,提取特征,Pipline 训练模型,GridSearchCV 寻找最优参数。用到的算法,NB, KNN,SVM,
39 2018-12-09 -
Glove词向量文本分类
文本建模,此项中的模型GLove,word2vec,在文本分类实用重要的作用
46 2019-05-15 -
基于CNN的文本分类
该文本内容详细介绍了CNN算法和文本分类的相互关系我觉得挺好的希望大家喜欢
39 2019-06-04 -
KNN文本分类算法研究
一片论文针对knn算法进行了解释与优化。
25 2019-07-15 -
LibSVM进行文本分类
包括调用LibSVM进行分类的程序,以及文本预处理部分的程序详情见:http://www.cnblogs.com/finallyliuyu/archive/2010/09/04/1818019.htm
36 2019-08-02 -
最大熵的文本分类
最大熵模型用于文本分类的例子,里面有数据集和Python代码
16 2019-07-06 -
文本分类特征选择VSM
文本分类的基本知识和其中重要的概念知识。
37 2018-12-15 -
中文文本分类实验
中文文本分类完整流程的简单实现,分词、去停用词、提取特征、计算文档的特征向量、支持向量机训练、测试文档分类,简单实现,其中词频统计、去停用词使用布隆过滤器加速,效果不错
49 2018-12-09 -
knn文本分类算法实现
利用knn算法,实现文本分类,使用开发语言为c++,代码没有问题,可以实现。
74 2019-05-02
暂无评论