Spark RDD.docx Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed Datasets,RDD)之上的,这使得 Spark 的各个组件可以无缝地进行集成,能够在同一个应用程序中完成大数据处理。本文将对 RDD 的基本概念及与 RDD 相关的概念做基本介绍。