Spark——大型集群上的快速和通用数据处理架构pdf

b66029 15 0 PDF 2020-08-14 09:08:01

基于大型集群的快速通用数据处理架构,为了实现上述的各种特性,我们通过简单的扩展 MapReduce,为其增加了数据共享原语,也就是所谓的弹性分布式数据集(RDDs)。我们发现,这样的扩展足以能够有效地覆盖大部分作业的需求。在开源的 Spark 系统中我们实现了 RDDs,同时使用了模拟测试程序和真实的用户应用对其进行评估。在许多应用领域中,Spark 已经接近或是超过了专有系统的性能,同时提供更强大的容错保证,并允许这些作业之间能够进行结合。我们从理论建模和实践的角度去探索 RDDs的通用性,来解释为什么这样的扩展可以覆盖大范围的不同作业需求。

用户评论

暂无评论

大数据处理原和MaxCompute实践.pdf

本资料为阿里巴巴计算平台事业部高级技术专家少杰在云栖大讲堂数据智能技术论坛上的演讲PPT。

18 2020-07-18
Spark大数据处理技术应用与性能优化大数据技术丛书.pdf

Spark大数据处理：技术、应用与性能优化 (大数据技术丛书).pdf，完整版的，需要的赶快下载

31 2019-04-01
数据算法Hadoop Spark大数据处理技巧.pdf中文扫描版带标签

《数据算法：Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案，以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapR

16 2019-05-20
数据算法Hadoop_Spark大数据处理技巧高清完整pdf版下载

.pdf全书686页，英文比中文容易理解本资料共包含以下附件： 724f58d66ab6b3c4c6412e91117878cb.zip《数据算法：Hadoop/Spark大数据处理技巧》介绍了

27 2019-01-09
matlab开发数据库中的大型数据处理案例研究

matlab开发-数据库中的大型数据处理案例研究。这些是2011年2月23日网络研讨会上使用的文件。

17 2020-08-12
数据算法Hadoop Spark大数据处理技巧完整版

原来的文件一百多兆传不上来，用软件压缩了大小不影响清晰度，是完整本

29 2019-06-04
奥运卫星遥感数据处理文件集群系统

本次“奥运卫星”所采用的蓝鲸集群文件系统，是为大型数据处理系统在集群环境下的数据传输和数据共享而设计的高性能存储集群系统。通过使用该系统，可以充分发挥集群系统的处理能力，有效管理海量存储空间，大幅度提

21 2020-07-30
MapReduce超大机群上的简单数据处理

计算利用一个输入key/value对集,来产生一个输出key/value对集.MapReduce库的用户用两个函数表达这个计算:map和reduce. 用户自定义的map函数,接受一个输入对,然后产生

24 2019-01-17
Python数据处理高清pdf

本书采用基于项目的方法，介绍用Python完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括：Python基础知识，如何从CSV、Excel、XML、JSON和PDF文

23 2019-03-16
Hadoop海量数据处理.pdf

hadoop海量数据处理

45 2018-12-09

Spark——大型集群上的快速和通用数据处理架构pdf

用户评论

推荐下载