集成方法:装袋RandomForest和AdaBoostClassifier 源码
在之前的实验中,我使用朴素贝叶斯(Naive Bayes)对此垃圾邮件进行分类。 在本笔记本中,我们将通过使用一些新技术(例如Bagging,RandomForest和AdaBoostClassifier)扩展先前的分析。 事实证明,我们的朴素贝叶斯模型实际上做得很好。 但是,让我们看一下其他一些模型,看看是否仍然无法改进。 特别是在本笔记本中,我们将研究以下技术: 可以找到有关合奏方法的另一个非常有用的指南。 这些合奏方法结合了多种技术: 引导通过学习者传递的数据(装袋)。 对用于学习者的功能进行子集化(与装袋组合表示随机森林的两个随机组成部分)。 将学习者聚集在一起,以使在某
文件列表
Ensemble-Methods-master.zip
(预估有个7文件)
Ensemble-Methods-master
images
tfidf.png
62KB
countvectorizer.png
36KB
dqnb.png
61KB
naivebayes.png
20KB
readme.md
2KB
Spam_&_Ensembles.ipynb
12KB
SMSSpamCollection
467KB
暂无评论