PQk均值 | | 同时使用k均值和PQk均值的2D示例 大规模评估 是一个Python库,用于对大型数据进行有效的聚类。 通过首先将输入向量压缩为短乘积量化(PQ)码,PQk-means可以实现快速且高效存储的聚类,即使对于高维向量也是如此。 与k-means相似,PQk-means重复分配和更新步骤,二者均可以在PQ代码域中执行。 为了进行比较,我们提供了用于二进制转换的ITQ编码和用于二进制代码聚类的 。 该库使用C ++编写,用于主要算法以及Python的包装程序。 所有编码/群集代码均与scikit-learn兼容。 功能概要 k均值的逼近 比k均值快几十到几百倍 内存效率是k