新闻分类:根据标题将新闻分类 源码
新闻分类 根据新闻标题将新闻分类。 尝试了各种分类器-决策树,支持向量分类器,多项朴素贝叶斯分类器,多层感知器,随机森林。 多项式朴素贝叶斯分类器效果最好。 即使我们人类根据关键字进行分类,多项式朴素贝叶斯算法也能发挥最佳效果,这是合乎逻辑的。 我们很可能会预测“政治”,因为我们会看到诸如奥巴马,大选,共和国之类的关键词;如果我们看到诸如毒品,监狱之类的关键词,我们可能会预测“犯罪”。 朴素贝叶斯扫描整个数据集,并找到标题中每个单词与某个类别相关联的概率,然后找到整个标题的概率,因此效果很好。 安装 pip install numpy pip install scikit-learn pip
文件列表
News-Classification-master.zip
(预估有个5文件)
News-Classification-master
hw5WrittenPart.pdf
47KB
news.py
5KB
README.md
1KB
news.ipynb
215KB
.gitignore
1KB
暂无评论