日期准备管道 首先,加载的地理位置文件是国家和地区的列表。 数据集将扩展到时间范围。 加载了其他数据模块,每个数据模块执行以下步骤: 文件加载 过滤 时间扩展 添加了日期/时间字段 标有缺失值 归因于缺失值 过滤到时间范围 已验证 合并 从多个数据集派生的任何数据都必须在ML管道中执行。 这样可以隔离数据模块,并允许派生的功能利用超参数搜索的优势。 例如,如果我们有一个导出的特征是另一个特征的移动平均值,则可以将移动平均值的时间段定义为超参数,并在训练期间搜索最佳值。 ML管道 ... 数据模块参考 每个数据模块包括以下内容: 一个Python文件,其中包含每个字段的常量,数据集的位置以