目录: 一、介绍 二、最值归一化 1.计算公式 2.Python实战 三、均值方差归一化 1.计算公式 2.Python实战 四、归一化要点 五、使用scikit-learn进行数据归一化 一、介绍 为什么需要进行数据归一化? 举个简单的例子,样本1以[1, 200]输入到模型中去的时候,由于200可能会直接忽略到1的存在。此时样本间的距离由时间所主导。 此时,如果将天数转换为占比1年的比例,200/365=0.5479, 100/365=0.2740。但也导致样本间的距离又被肿瘤大小所主导。因此有必要进行数据归一化处理。不然直接计算样本间的距离是有一定偏差的。 解决方案: 将所有的数据映