Ta上传的资源 (0)

按照源码分析的习惯设计,从脚本分析到初始化,再到核心内容。整个过程遵循由浅入深的基本思路。每一章先对本章的内容有个总体介绍,然后深入分析各个组件的实现原理,最后将各个组件之间的关系通过执行流程来展现。本书尽可能地用图来展示原理,以加速读者对内容的掌握。本书讲解的很多实现及原理都值得借鉴,可以帮助读者

Spark是当今大数据领域最活跃、最热门、高效的大数据通用计算平台,是Apache软件基金会下所有开源项目中三大开源项目之一。在“OneStacktorulethemall”理念的指引下,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、

过去的几年中,计算系统经历着重大的变革,为了满足不断增长的数据量和处理速度需求, 越来越多的应用向分布式系统扩展。如今,从互联网到企业运作,再到科技设备,不尽其数的 数据源都在产生大量的、有价值的数据流。然而,单一的机器处理能力并没有跟上数据增长的 速度,使得这些有价值的数据越来越难以被使用。以至于