目前开源大数据计算引擎有很多选择,流计算如Storm、Samza、Flink、KafkaStream等,批处理如Spark、Hive、Pig、Flink等。而同时支持流处理和批处理的计算引擎,只有两种选择:一个是ApacheSpark,一个是ApacheFlink