自打Hive出现之后,经过几年的发展,SQLonHadoop相关的系统已经百花齐放,速度越来越快,功能也越来越齐全。本文并不是要去比较所谓“交互式查询哪家强”,而是试图梳理出一个统一的视角,来看看各家系统有哪些技术上相通之处。以下是作者原文:考虑到系统使用的广泛程度与成熟度,在具体举例时一般会拿Hive和Impala为例,当然在调研的过程中也会涉及到一些其他系统,如SparkSQL,Presto,TAJO等。而对于HAWQ这样的商业产品和apachedrill这样成熟度还不是很高的开源方案就不做过多了解了。在SQLonHadoop系统中,有两种架构,一种是基于某个运行时框架来构建查