数据的爆炸式增长和隐藏在这些数据背后的商业价值催生了一代又一代的大数据处理 技术。十年前Hadoop横空出世,Cloudera首席架构师DougCutting先生将Google的 MapReduce思想用开源的方式实现出来,由此拉开了基于MapReduce的大数据处理框架 在企业中应用的序幕。最近几年,Hadoop生态系统又发展出以Spark为代表的新计算框 架。相比MapReduce,Spark速度快,开发简单,并且能同时兼顾批处理和实时数据分析。 Spark起源于加州大学伯克利分校的AMPLab,Cloudera公司作为大数据市场上的翘楚很 早就开始将Spark推