pandora:XPRIZE大流行应对挑战的数据准备管道 源码
日期准备管道 首先,加载的地理位置文件是国家和地区的列表。 数据集将扩展到时间范围。 加载了其他数据模块,每个数据模块执行以下步骤: 文件加载 过滤 时间扩展 添加了日期/时间字段 标有缺失值 归因于缺失值 过滤到时间范围 已验证 合并 从多个数据集派生的任何数据都必须在ML管道中执行。 这样可以隔离数据模块,并允许派生的功能利用超参数搜索的优势。 例如,如果我们有一个导出的特征是另一个特征的移动平均值,则可以将移动平均值的时间段定义为超参数,并在训练期间搜索最佳值。 ML管道 ... 数据模块参考 每个数据模块包括以下内容: 一个Python文件,其中包含每个字段的常量,数据集的位置以
文件列表
pandora-master.zip
(预估有个33文件)
pandora-master
pandora
encoders.py
5KB
imputers.py
661B
__init__.py
0B
core_fields.py
811B
loader.py
5KB
imputer.py
1KB
core_types.py
930B
requirements.txt
94B
暂无评论