目录1.归一化1.1.最值归一化(normalization)1.2.均值方差归一化(standardization)1.3.Sklearn中的归一化2.缺失值处理2.1.确定缺失值范围2.2.填充缺失内容2.2.1.平均值填充法2.2.2.中位数填充法2.2.3.条件平均值填充法2.2.4.模型预测填充法2.2.4.1.kNN2.2.4.2.Regression2.2.5.利用sklearn填补缺失值3.处理分类型特征:编码与哑变量4.处理连续型特征:二值化与分段 1.归一化 问题:在量纲不同的情况下,不能反映样本中每一个特征的重要程度。 方案:数据归一化,即标准化。把所有的数据都映射到同一