言:随着大数据技术的发展,实时流计算、机器学习、图计算等领域成为较热的研究方向,而Spark作为大数据处理的“利器”有着较为成熟的生态圈,能够一站式解决类似场景的问题。那么Spark生态系统中有哪些组件你知道吗?下面让我们跟着本文一同了解下 这些不可或缺的组件。本文选自《图解Spark:核心技术与案例实战》。Spark生态系统以SparkCore为核心,能够读取传统文件(如文本文件)、HDFS、Amazon S3、Alluxio和NoSQL等数据源,利用Standalone