本文主要调研了ApacheKafka、ApacheFlink、ApacheStorm、ApacheApex和ApacheSparkStreaming五种流式大数据系统。主要的工作有:1)通过文献阅读和试用比较了它们的实现原理;2)利用了kafka自带的测试脚本进行了kafka性能测试;3)通过Hibench进行了Flink、Storm和SparkStreaming的比较测试;4)进行了Apex的简单测试;5)对以上流式大数据系统进行了总结分析。