Spark这个诞生了7年的开源框架已经成为了今天大数据市场上最炙手可热的词汇。而即将到来的Spark2.0将会成为这个项目的一个重大的里程碑。也许你会感兴趣新的版本中那些激动人心的特性:DataFrame、SparkR、StreamingML以及DatasetAPI,那么我将在这个议题里面与你一同展望。此外,作为开发者的你或许希望可以了解围绕Spark应用开发的一切。我将以Python为例,聊一聊如何Spark引擎开发诸如实时数据流或者批任务这一类数据密集性应用。