本书介绍大量特征工程技术,阐明特征工程的基本原则。主要内容包括:机器学习流程中的基本概念,数值型数据的基础特征工程,自然文本的特征工程,词频-逆文档频率,高效的分类变量编码技术,主成分分析,模型堆叠,图像处理。