featran:一个用于数据科学和机器学习的Scala功能转换库 源码
菲特兰 Featran,也称为Featran77或F77(明白吗?),是一个用于功能转换的Scala库。 它旨在简化在数据科学和机器学习过程中进行要素工程的耗时任务。 它支持用于特征提取的各种集合类型以及用于特征表示的输出格式。 介绍 大多数功能转换逻辑需要两个步骤,一个是全局汇总以汇总数据,然后是一个逐元素映射以对其进行转换。 例如: 最小最大缩放器 汇总:全局最小值和最大值 映射:将每个值缩放为[min, max] 一站式编码器 汇总:不同的标签 映射:将每个标签转换为二进制向量 我们可以使用reduce和map以幼稚的方式实现它。 case class Point ( score
文件列表
featran:一个用于数据科学和机器学习的Scala功能转换库
(预估有个144文件)
.gitignore
63B
cars.data
14KB
LICENSE
11KB
.scalafix.conf
241B
JRecordExtractor.java
1KB
JFeatureSpec.java
9KB
JFeatureExtractor.java
3KB
SerializableFunction.java
776B
JavaTestUtil.java
2KB
JavaExample.java
3KB
暂无评论