datafu, 用于大规模数据处理的Hadoop库,现在是一个 Apache Incubator 项目 Apache DataFu跟踪 @apachedatafu 。是一个用于在Hadoop中处理大规模数据的库集合。 这个项目的灵感来自于对数据挖掘和统计的稳定。测试良好的库。它由两个库组成:Apache Pig的价格为: 用户定义