自治区 目录 介绍 是一个python库平台,用于为机器学习准备表格数据。 用户可以在自动推断列属性之间进行选择,以应用适当的简单要素工程方法,或者可以将不同的列分配给自定义要素工程转换,要素工程转换的自定义集(例如“族树”),以及从以下选项中进行选择:缺少数据填充。 可以从内部库(也称为“功能转换存储”)中访问功能工程转换,也可以在外部对用户进行定义,而对简单数据结构的最低要求。 该工具包括用于自动特征重要性评估的选项,用于使用在集合上训练的机器学习模型自动导出缺失数据输入的“ ML填充”,用于标签类不平衡的过采样的自动准备,基于特征重要性的自动降维,主体组件分析(PCA)或二进制编码,可以自动评估训练数据与后续数据之间的数据属性漂移,这也许是最重要的最简单的方法,可通过单个函数调用来一致地处理其他数据。 换句话说,简单地说: automunge(。)准备用于机器学习的表格数据。