大数据spark学习之rdd概述
RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合。在 Spark 中,对数据的所有操作不外乎创建 RDD、转化已有RDD 以及调用 RDD 操作进行求值。每个 RDD 都被分为多个分区,这些分区运行在集群中的不同节点上。RDD 可以包含 Python、Java、Scala 中任意类型的对象, 甚至可以包含用户自定义的对象。RDD具有数据流模型的特点:自动容错、位置感知性调度和可伸缩性。RDD允许用户在执行多个查询时显式地将工作集缓存在内存中,后续的查询能够重用工作集,这
用户评论
推荐下载
-
大数据导论spark编程基础PPT
spark编程基础课件 适合初学者 有需要的可以下载看看 巴拉巴拉巴巴
34 2019-02-25 -
spark大数据平台完整视频资料
spark大数据平台完整视频资料
25 2019-02-24 -
基于spark的大数据论文资料
本资料是集合20篇知网被引最高的基于spark的大数据论文,包括大数据Spark技术研究_刘峰波、大数据下基于Spark的电商实时推荐系统的设计与实现_岑凯伦、基于Spark的Apriori算法的改进
22 2019-05-17 -
Spark快速大数据分析.pdf
Spark 是一个用来实现快速而通用的集群计算的平台。 在速度方面,Spark 扩展了广泛使用的 MapReduce 计算模型,而且高效地支持更多计算模 式,包括交互式查询和流处理。在处理大规模数据集
22 2019-04-08 -
Spark大数据分析实战.pdf
Spark大数据分析实战 ,高彦杰,倪亚宇著
27 2019-04-12 -
大数据Spark企业级实战
大数据Spark企业级实战,PDF电子版,带书签,非常清晰喔~
37 2019-04-05 -
Spark大数据处理技术.pdf
Spark大数据处理技术PDF高清带目录完整版夏俊鸾黄洁程浩等人著作学习大数据值的经典入门图书
37 2019-05-27 -
Spark高级大数据分析PDF
本书首先介绍了Spark及其生态系统,接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金融领域的若干模式。如果你对机器学习和统计学有基本的了解,并且会用Java、Python或S
28 2019-05-28 -
Spark大数据案例分析和介绍
hadoopsparkparameterserver框架介绍,案例:计算广告、智慧城市、大数据背景下的金融产品定价
23 2019-06-01 -
Spark快速大数据分析.rar
难得的spark系统学习资料。书比较新,完整书签。适合系统学习spark的同学
28 2019-07-19
暂无评论