ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎,Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。