中文 Spark: The Definitive Guide: Big Data Processing Made Simple 中文part2

Jack_Ju 45 0 PDF 2019-04-17 18:04:08

Spark:权威指南:简化大数据处理中文第2部分 (共3部分) 通过这个由这个开源集群计算框架的创建者编写的综合指南,了解如何使用,部署和维护Apache Spark。作者重点介绍Spark 2.0中的改进和新功能,作者Bill Chambers和Matei Zaharia将Spark主题分解为不同的部分,每个部分都有独特的目标。 您将探索Spark结构化API的基本操作和常用功能,以及用于构建端到端流应用程序的新型高级API Structured Streaming。开发人员和系统管理员将学习监控,调优和调试Spark的基础知识,并探索机器学习技术和场景,以便使用Spark的可扩展机器学习库MLlib。 轻松了解大数据和Spark 通过工作示例了解Dat aFrames,SQL和Datasets-Spark的核心API 深入了解Spark的低级API,RDD以及SQL和DataFrame的执行 了解Spark如何在群集上运行 调试,监视和调整Spark集群和应用程序 了解Spark的结构化流媒体和MLlib在机器学习任务中的强大功能 探索更广泛的Spark生态系统,包括SparkR和Graph Analysis 检查Spark部署,包括云中Spark的覆盖范围 aFrames,SQL和Datasets-Spark的核心API 深入了解Spark的低级API,RDD以及SQL和DataFrame的执行 了解Spark如何在群集上运行 调试,监视和调整Spark集群和应用程序 了解Spark的结构化流媒体和MLlib在机器学习任务中的强大功能 探索更广泛的Spark生态系统,包括SparkR和Graph Analysis 检查Spark部署,包括云中Spark的覆盖范围

用户评论
请输入评论内容
评分:
暂无评论