spark:Apache Spark 用于大规模数据处理的统一分析引擎源码

duplicate_92628 9 0 ZIP 2021-02-26 23:02:18

Apache Spark Spark是用于大规模数据处理的统一分析引擎。它提供了Scala,Java,Python和R中的高级API,以及优化的引擎,该引擎支持用于数据分析的通用计算图。它还支持丰富的高级工具集,包括用于SQL和DataFrames的Spark SQL,用于机器学习的MLlib,用于图形处理的GraphX和用于流处理的结构化流。在线文件您可以在找到最新的Spark文档,包括编程指南。该自述文件仅包含基本的安装说明。建筑火花 Spark是使用构建的。要构建Spark及其示例程序,请运行: ./build/mvn -DskipTests clean package

用户评论

暂无评论

Mastering Apache Spark

Big data is getting bigger and bigger day by day. And I don't mean tera, peta, exa, zetta, and yotta

51 2019-03-18
apache spark tutorial

大数据apachespark入门文档，适合初学者，带你入门spark大数据

30 2019-07-17
mastering apache spark

精通apachespark，关于spark的最新资料，大数据必备。

32 2019-09-18
Practical Apache Spark

Work with Apache Spark using Scala to deploy and set up single-node, multi-node, and high-availabili

17 2021-04-26
Apache SPARK介绍

介绍 Apache SPARK 的基本功能了使用

37 2019-01-02
如何优化Spark在大数据处理中的效率

Spark是目前大数据处理中使用最广泛的技术之一，但是在处理海量数据时，Spark的效率也会受到一定的影响。本文将介绍如何通过对Spark的优化来提高处理效率。具体内容包括：1.合理设置Spark的e

12 2023-06-05
azure kusto spark适用于Azure Kusto的Apache Spark连接器源码

azure-kusto-spark:适用于Azure Kusto的Apache Spark连接器

17 2021-02-01
面向HBase的大规模数据加载研究

分布式数据库HBase在大规模数据加载中较传统关系型数据库有较大的优势但也存在很大的优化空间.基于Hadoop分布式平台搭建HBase环境,并优化自定义数据加载算法.首先,分析HBase底层数据存储,

22 2019-01-11
Stripe的大规模数据在线迁移经验

技术团队在构建软件时面临的困难总是相似的:到最后他们总是不得不重新设计他们所使用的数据模型,以此来支持更干净的抽象和更复杂的功能。在生产环境里,这可能就要意味着迁移几百万条活跃的数据,以及重构数以千行

24 2021-02-01
Learning Spark书源码Spark快速大数据分析源码

Learning Spark书源码，中文书名，Spark快速大数据分析源码

23 2019-04-12

spark:Apache Spark 用于大规模数据处理的统一分析引擎 源码

用户评论

推荐下载

spark:Apache Spark 用于大规模数据处理的统一分析引擎源码