sparklyr:Apache Spark的R接口 使用YARN,Mesos,Livy或Kubernetes安装并连接到 。 使用过滤和聚合Spark数据集和然后将它们带入R进行分析和可视化。 使用 , , 和在Spark中大规模训练模型。 创建可互操作的机器学习,并使用生产它们。 创建调用完整Spark API的或运行代码以支持新功能。 安装 您可以按照以下步骤从安装sparklyr软件包: install.packages( " sparklyr " ) 您还应该为开发目的安装本地版本的Spark: library( sparklyr ) spark_install()