Ta上传的资源 (0)

天池比赛——二手车价格预测数据分析文档 熟悉数据 查看缺失值情况 分析数据类型及分布 分析数据间相关性

特征工程主要进行以下一些操作: 1.导入数据 2.删除异常值:截断过大或过小值的数据 3.特征构造: - 广告发布时间:将年、月、日信息单列出来 - 汽车使用时间=广告时间-注册时间 - 城市信息=邮政编码后三位 - 销售统计量:比如价格的最大最小值、中位数、均值、方差等 4.数据分桶:对功率等数值