资源名称:PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署内容简介:本文从Spark的基本特点出发,借助大量例子详细介绍了如何使用Python调用Spark新特性、处理结构化及非结构化数据、使用PySpark中基本可用数据类型、生成机器学习模型、进行图像操作以及阅读串流数据等新兴技术内容。资源目录:译者序序前言关于作者第1章 了解Spark11.1 什么是Apa 资源太大,传百度网盘了,链接在附件中,有需要的同学自取。