几点思考: 1、对pandas的使用就像是操作SQL语句, 总体说是增删改查, 但是涉及到联表, 涉及到分组,涉及到不同数据类型的操作,就有很多tricks在里面, 这些tricks是需要在不断的学习->使用中不断精进和掌握; 2、特征中包含datetime类型特征的时候, 可以依此分组构造新的时序特征, (1) 是否是周末? (2) 是一个月的第几天? (3) 趋势特征 (4) 其他 3、值得fork的代码是: (1) 数值类型特征异常值检测处理方法; (2) 反应时间趋势特征的指数加权移动平均的方法; (3) 时序特征统计量 4、不同的机器学习算法对特征的构造方式是有区别的, 比如KNN算