草图 sketch是一个通用的仅标头的库,为可伸缩和流式应用程序提供了各种草图数据结构的实现。除非-DNOT_THREADSAFE作为编译标志传递,否则在可能的情况下,所有这些都已通过SIMD并行性进行了加速,大多数都是可组合的,并且许多都是线程安全的。 内容 HyperLogLog实现[hll.h] hll_t / hllbase_t 使用log(log(cardinality))位估计集合的基数。 除非通过-DNOT_THREADSAFE否则为-DNOT_THREADSAFE 。 目前, hll是唯一可以使用python绑定的结构,但是我们打算在将来扩展它。 HyperBitBit [hbb.h]比HyperLogLogs更好的每位精度,但至少目前,草图大小限制为128位/ 16字节。 布隆过滤器[bf.h] bf_t / bfbase_t<HashSt