数据挖掘任务主要分为两种:描述性任务和预测性任务 1.描述性任务 定义:描述性任务将发掘数据中潜在的规律,找出目前可以理解与描述数据集中数据之间的联系,并刻画数据集中数据的一般特性。 描述性任务一般采用的挖掘步骤:业务理解、数据理解、数据准备(即对数据进行预处理、生成相关特征)、模型建立(即属性之间的相关性分析、关联规则分析、聚类分析等)、模型评估。 下面对这几个挖掘步骤作为详细解释: 1)业务理解:确定待解决的问题(如电信用户信用度逐年下降,产品销售量逐年下降) 2)数据理解:1收集原始数据2描述数据(即对数据属性进行文字描述。产生数据描述报告)3探索数据(对数据进行基本 分析,验证数据质量