Kafka是LinkedIn开源的分布式发布-订阅消息系统,目前归属于Apache顶级项目。其追求高吞吐量,适合产生大量数据的互联网服务的数据收集业务。(常作为Spark Streaming的数据源)