在GitHub上找到的,国内某大牛JerryLead对spark的理解,生动形象,看完这7个pdf,对spark的运行机制,原理,以及后续性能调优有很大的帮助,这是第一个pdf-概览,以图形式描述了spark的部署;一个Job的例子及对该Job的逻辑执行图、物理执行图进行了简要的讨论,引出后续的6个pdf内容