Apache Spark 的设计与实现
本文主要讨论 Apache Spark 的设计与实现,重点关注其设计思想、运行原理、实现架构及性能调优,附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“源码分析”,因为本文的主要目的不是去解读实现代码,而是尽量有逻辑地,从设计与实现原理的角度,来理解 job 从产生到执行完成的整个过程,进而去理解整个系统。 讨论系统的设计与实现有很多方法,本文选择 问题驱动 的方式,一开始引入问题,然后分问题逐步深入。从一个典型的 job 例子入手,逐渐讨论 job 生成及执行过程中所需要的系统功能支持,然后有选择地深入讨论一些功能模块的设计原理与实现方式。也许这样
用户评论
推荐下载
-
spark records带有快速故障根源分析的防弹Apache Spark作业源码
spark-records:带有快速故障根源分析的防弹Apache Spark作业
9 2021-02-17 -
apache与tomcat负载集群的实现
apache与tomcat联合实现负载平衡与集群的实现
32 2019-06-01 -
Spark内核设计的艺术架构设计与实现.pdf带书签可复制
全书分为10章。第1章介绍Spark学习环境的搭建。第2章介绍Spark的基本知识和架构。第3章介绍Spark内核底层的基础设施。第4章介绍SparkContext的初始化。第5章介绍Spark执行环
28 2020-06-19 -
Spark技术内幕深入解析Spark内核架构设计与实现原理高清完整书签
Spark技术内幕深入解析Spark内核架构设计与实现原理高清完整书签
26 2019-05-04 -
Spark技术内幕_深入解析Spark内核架构设计与实现原理高清书签版
Spark 是大数据分析解决方案家族中备受瞩目的成员。它不仅为分布式数据集的处理提供了一个有效的框架,而且以高效的方式处理分布式数据集。它支持实时处理、流处理和批处理,为 AllinOne 提供了统一
32 2019-06-21 -
Spark技术内幕深入解析Spark内核架构设计与实现原理带书签目录
spark是一种快速、通用、可扩展的大数据分析引擎。Spark核心的概念是ResilientDistributedDataset(RDD):一个可并行操作的有容错机制的数据集合。有2种方式创建RDDs
30 2019-09-26 -
基于Spark的电商推荐系统的设计与实现焦健.caj
基于Spark的电商推荐系统的设计与实现焦健.caj
7 2023-01-10 -
Apress.Pro.Spark.Streaming.The.Zen.of.RealTime.Analytics.Using.Apache.Spark
Apress.Pro.Spark.Streaming.The.Zen.of.Real-Time.Analytics.Using.Apache.Spark
39 2019-09-26 -
spark doc zh Apache Spark官方文档中文版源码
Apache Spark官方文档中文版 Apache Spark?是一个快速的,用于海量数据处理的通用引擎。 任何一个傻瓜都会写能够让机器理解的代码,只有好的程序员才能写出人类可以理解的代码。——马丁
18 2021-02-07 -
awesome spark很棒的Apache Spark软件包和资源的精选列表源码
awesome-spark:很棒的Apache Spark软件包和资源的精选列表
24 2021-02-01
暂无评论