ruby spark:Apache Spark的Ruby包装器 源码

partly73861 24 0 ZIP 2021-02-01 22:02:11

Ruby火花 Apache Spark:trade_mark:是用于大规模数据处理的快速通用引擎。 该Gem允许在Ruby上使用Spark功能。 Spark的Ruby API中的字数统计 file = spark . text_file ( "hdfs://..." ) file . flat_map ( :split ) . map ( lambda { | word | [ word , 1 ] } ) . reduce_by_key ( lambda { | a , b | a + b } ) 安装 要求 Java 7+ Ruby2+ wget或

用户评论
请输入评论内容
评分:
暂无评论