我们谈大数据性能调优,到底在谈什么,它的本质是什么,以及Spark在性能调优部份的要点,这两点让在进入性能调优之前都是一个至关重要的问题,它的本质限制了我们调优到底要达到一个什么样的目标或者说我们是从什么本源上进行调优。希望这篇文章能为读者带出以下的启发:了解大数据性能调优的本质了解Spark性能调优要点分析了解Spark在资源优化上的一些参数调优了解Spark的一些比较高效的RDD操作算子