垃圾邮件 实现一个垃圾短信识别系统,在给定的数据集上验证效果。 短信数据 标签域:1表示垃圾短信/ 0表示正常短信 文本域:短信源文本(进行了一些处理) 分类算法 KNN:K最近邻 LR:逻辑回归 RF:随机森林 DT:决策树 GBDT:梯度提升决策树 SVM:支持向量机 多项式NB:多样式分布朴素贝叶斯 BernoulliNB:伯努利分布朴素贝叶斯 环境依赖 Classfier(模型训练) (已集成至项目内,无需安装) 站点(演示样本) 项目结构 . ├──Classfier(模型训练) │ ├── DataProcess(数据预处理) │ │ ├── jieba(结巴分词库) │ │ ├── DataPreprocess.py(数据预处理) │ │ └── message.txt(训练数据) │ │ │ └── Classifiers.py(分类器) │