数据处理第一步:清洗和提炼
数据清洗的概念和方法总结 部分代码练习 1.数据清洗的概念和方法总结 2.部分代码练习 其中包含: 2.1识别和处理缺失值 2.2数据标准化 2.3数据归一化 2.4查看数据分布的分箱和指标变量 数据清洗的目的:将数据转化为一种方便分析的格式 首先导入数据 !pip install pandas==0.25.0 import pandas as pd#添加库 df = pd.read_csv("地址", names = headers)#导入数据 df.head()#查看dataframe前5(默认)行 1 识别和处理缺失值 import numpy as np #一般的缺失值再数据中显示为