实时计算Samza中文教程.pdf

pigbin 9 0 PDF 2021-05-10 19:05:33

Samza是一款优秀的分布式流处理框架,非常像Twitter的流处理系统Storm(即Lambda架构Hadoop+Storm)。不同的是Samza基于Hadoop,而且使用了LinkedIn自家的Kafka分布式消息系统(即Kappa架构Kafka+Samza)。其优势在于:相对于Storm大部分是用Clojure实现的而言,Samza底层的实现语言是Scala和Java,而且代码不到万行,堪称小而美,从而可以更加低成本地去了解其实现,并作扩展和优化。因此,Samza成为越来越流行的流处理首选框架。本教程高屋建瓴,深入浅出,全面地介绍了Samza的基本概念和框架结构,系统地剖析了Samza的运行机理,并从其数据流处理逻辑的角度详解了其主要的API。本教程适合初学者快速入门,能让你在迅速掌握Samza的同时深刻理解流计算系统。

用户评论
请输入评论内容
评分:
暂无评论