暂无评论
一.弹性分布式数据集-RDD RDD是Spark核心数据结构,它是逻辑集的实体,在集群中多台机器之间进行数据分区,通过对多台机器上RDD分区的控制,能够减少数据的重排(data Shuffling)。
系列博客是学习厦门大学林子雨老师spark编程基础课程的笔记,方便回顾 系列博客: Spark学习笔记(一):Spark概述与运行原理 Spark学习笔记(二):RDD编程基础 Spark SQL
一.Spark执行机制 1.执行机制总览 Spark应用提交后经历一系列转变,最后成为task在各个节点上执行。 RDD的Action算子触发job的提交,提交到Spark的Job生成RDD DAG,
pdf原版,HighPerformanceSpark(高性能Spark)前4章,覆盖spark最新的dataframe接口。
Spark权威指南(Spark2) 2018年11月出版,目前只出了英文版,中文版还没有出。
spark相关资料,提高spark技术必备
SparkforDataScience,spark2.0
spark-website:Apache Spark网站
下载解压到sdk\platforms 目录即可
网上收集整理的桂林市区域30分辨率DEM影像,需要的拿去使用吧
暂无评论