Spark源码系列(一)spark submit提交作业过程
折腾了很久,终于开始学习Spark的源码了,第一篇我打算讲一下Spark作业的提交过程。这个是Spark的App运行图,它通过一个Driver来和集群通信,集群负责作业的分配。今天我要讲的是如何创建这个Driver Program的过程。我们先看一下用SparkSubmit提交的方法吧,下面是从官方上面摘抄的内容。这个是提交到standalone集群的方式,打开spark-submit这文件,我们会发现它最后是调用了org.apache.spark.deploy.SparkSubmit这个类。我们直接进去看就行了,main函数就几行代码
用户评论
推荐下载
-
Spark Sql源码解析
详细描述了Spark-sql的原理,从sql语句如何转换为逻辑计划,然后是物理计划,最后是rdd
11 2020-08-09 -
terraform cloudfoundry spark源码
terraform-cloudfoundry-spark
7 2021-02-24 -
spark cluster docker源码
Spark集群Docker 由提供支持 该存储库包含Docker文件,以使用JupyterLab接口创建一个Spark集群。 该集群用作Rock JVM在线课程和Apache Spark上的实时培训课
16 2021-04-18 -
Spark2.6.3源码
spark源码,只包含java目录下面的内容,并没有包含资源,表情符号等。java目录下面是核心代码目录,包含所有实现
9 2020-08-09 -
java pubsublite spark源码
适用于Java的Google Pub / Sub Lite Spark连接器客户端 适用于Java惯用客户端。 注意:此客户端是一个进行中的工作,有时可能会进行向后不兼容的更改。 快速开始 如果您使用
8 2021-02-24 -
PML Spark PCA源码
PML--Spark-PCA
8 2021-02-20 -
Spark1613源码
Openfire客户端Spark1.6.13版本,你也可以从http://svn.igniterealtime.org/svn/repos/spark/trunk/上下载
44 2019-01-08 -
spark2.02源码
spark2.02的源码,可用于编译,本地运行与调试,如果是spark的初学者,应该是很好的参考
3 2020-08-10 -
北风网spark课程源码spark_study_scala.rar
北风网spark课程源码spark-study-scala.rar,
28 2019-06-01 -
Udacity Datalake Spark具有Spark的Udacity数据湖源码
Sparkify的Data Lake ELT流程 概括 介绍 该项目将为Sparkify提取歌曲和日志数据,以使其更易于理解其数据并对该数据进行分析。 该项目正在使用EMR将数据处理到S3上。 入门
6 2021-03-02
暂无评论