NLP实战之sklearn+逻辑回归进行THUCNews文本分类python
通过对数据进行分词、停词过滤、TfidfVectorizer/CountVectorizer处理,利用sklearn中是逻辑回归对THUCNews进行分类,包含数据集
文件列表
CNew.rar
(预估有个7文件)
cnews.val.txt
11.24MB
LR.py
4KB
cnews.test.txt
26.23MB
CNEWS_test.py
4KB
LR_CountVectorizer.py
4KB
cnews.vocab.txt
19KB
cnews.train.txt
124.06MB
暂无评论