数据分析与数据挖掘的方法 1.频繁模式 频繁模式:数据中频繁出现的模式。 频繁项集:频繁在事务数据集中一起出现的商品集合。 例如,信用卡分析、患者就诊分析、购物车分析... 2.分类与回归 分类与标签预测是找出描述和区分数据类或概念的模型或函数,以便能够使用模型预测类标识未知的对象的类标号。 分类预测类别(离散的、无序的)标号,回归建立连续值函数模型,也就是用来预测缺失的或难以获得的数值数据值。 典型方法:决策树、朴素贝叶斯分类、支持向量机、神经网络、规则分类器、基于模式的分类、逻辑回归... 3.聚类分析 聚类就是把一些对象划分为多个组或者“聚簇”,从而使得同组内对象间比较相似而不同组对象间的差异较