如何使用SparkMLlib构建分类模型?

engineer_seu 5 0 PDF 2021-02-25 04:02:03

1.预测互联网用户对在线广告的点击概率(二分类问题);2.检测欺诈(二分类问题,欺诈或者不欺诈);3.预测拖欠贷款(二分类问题);4.对图片、音频、视频进行分类(多分类问题);5.对新闻、网页或者其他内容进行分类或者打标签(多分类);6.发现垃圾邮件、垃圾页面、网络入侵和其他恶意行为 ;7.检测故障,比如计算机系统或者网络故障检测;8.预测顾客或者客户中谁有可能停止使用某个产品或服务。1.线性模型原理:对样本的预测结果(目标变量)进行建模,即对输入特征应用简单的线性预测函数。 1.1逻辑回归 1.2线性支持向量机 2.朴素贝叶斯模型(前提:假设各个特征之间条件独立) 3.决策树

用户评论
请输入评论内容
评分:
暂无评论