据不完全统计,在生产环境中部署 Impala 集群时,大部分大数据工程师也会赠送一套 Kudu 环境,当然用不用另说。如果只部署了 Impala 而没有 Kudu,那应该是一个意外。如果部署了 Kudu,而没有 Impala,说明用户都是高手,喜欢有挑战性的工作。当然如果没有 Impala 和 Kudu,就很正常了,因为可能用了 Presto、Clickhouse 或 Doris 等。 今天笔者给大家带来一篇借助 Kudu 来提升 Impala 稳定性和吞吐量的文章,素材来自 Cloudera 工程师在 Strata Data Conference 2019 大会上分享的主题,《Acceler