spark:Apache Spark 用于大规模数据处理的统一分析引擎 源码
Apache Spark Spark是用于大规模数据处理的统一分析引擎。 它提供了Scala,Java,Python和R中的高级API,以及优化的引擎,该引擎支持用于数据分析的通用计算图。 它还支持丰富的高级工具集,包括用于SQL和DataFrames的Spark SQL,用于机器学习的MLlib,用于图形处理的GraphX和用于流处理的结构化流。 在线文件 您可以在找到最新的Spark文档,包括编程指南。 该自述文件仅包含基本的安装说明。 建筑火花 Spark是使用构建的。 要构建Spark及其示例程序,请运行: ./build/mvn -DskipTests clean package
用户评论
推荐下载
-
Mastering Apache Spark
Big data is getting bigger and bigger day by day. And I don't mean tera, peta, exa, zetta, and yotta
51 2019-03-18 -
apache spark tutorial
大数据apachespark入门文档,适合初学者,带你入门spark大数据
30 2019-07-17 -
mastering apache spark
精通apachespark,关于spark的最新资料,大数据必备。
32 2019-09-18 -
Practical Apache Spark
Work with Apache Spark using Scala to deploy and set up single-node, multi-node, and high-availabili
17 2021-04-26 -
Apache SPARK介绍
介绍 Apache SPARK 的基本功能了使用
37 2019-01-02 -
如何优化Spark在大数据处理中的效率
Spark是目前大数据处理中使用最广泛的技术之一,但是在处理海量数据时,Spark的效率也会受到一定的影响。本文将介绍如何通过对Spark的优化来提高处理效率。具体内容包括:1.合理设置Spark的e
12 2023-06-05 -
azure kusto spark适用于Azure Kusto的Apache Spark连接器源码
azure-kusto-spark:适用于Azure Kusto的Apache Spark连接器
17 2021-02-01 -
面向HBase的大规模数据加载研究
分布式数据库HBase在大规模数据加载中较传统关系型数据库有较大的优势但也存在很大的优化空间.基于Hadoop分布式平台搭建HBase环境,并优化自定义数据加载算法.首先,分析HBase底层数据存储,
22 2019-01-11 -
Stripe的大规模数据在线迁移经验
技术团队在构建软件时面临的困难总是相似的:到最后他们总是不得不重新设计他们所使用的数据模型,以此来支持更干净的抽象和更复杂的功能。在生产环境里,这可能就要意味着迁移几百万条活跃的数据,以及重构数以千行
24 2021-02-01 -
Learning Spark书源码Spark快速大数据分析源码
Learning Spark书源码,中文书名,Spark快速大数据分析源码
23 2019-04-12
暂无评论