PySpark算法书的源代码 通过PySpark算法解锁大数据的力量 PySpark算法书: 作者:Mahmoud Parsian( ) 发布日期:2019年8月 关于PySpark算法书 本书是关于PySpark(Spark的Python API) 关于如何使用PySpark解决数据问题的入门书 了解如何使用映射器,过滤器和简化器 了解如何对数据进行分区以进行快速查询 了解如何使用mapPartitions()转换 了解如何使用reduceByKey() , groupByKey()和groupByKey() combineByKey()转换 了解如何使用Spark的转换和动作来解决实际