Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源(包括 Hadoop 和各类文件)和在线数据源(如 Kafka)中攫取数据进行分析。Pinot 被设计是可以进行水平扩展的。Pinot 特别适合这样的数据分析场景:分析模型固定,数据只追加以及低延迟,以及分析结果可查询。关键特性:面向列的数据库,提供多种压缩模式,如运行长度、固定比特长度可插入式的索引技术,包括可排序索引、Bitmap 索引和反向索引可根据查询和段元数据对查询和执行进行优化近乎实时的从 Kafka 获取数据,以及批量从 Hadoop 获取数据