示例性机器学习管道 介绍 该存储库旨在充当任何表格数据问题的示例性数据科学和机器学习管道。 此外,笔记本旨在探索两个用于机器学习自动化的Python软件包: featuretools和h2o 。 featuretools专门从事特征工程,而h2o专门从事建模。 按照指示的顺序操作笔记本。 从广义上讲,这是我们涵盖的内容: 数据洞察和可视化 数据清理 数据插补 手动特征工程 通过featuretools自动特征工程 功能缩放 功能选择 功能编码 通过h2o建模(模型选择和分析) 我们可以提出两个主要论点: 当前,我们所谓的自动机器学习与为解决实际数据问题而必须创建的实际机器学习工作流程之