spark annoy:在Apache Spark上构建Annoy索引 源码

employment656 24 0 ZIP 2021-02-19 06:02:57

Spark-Annoy(WIP) 在Apache Spark上构建 Index。 然后使用Annoy查询邻居。 注意 我在5分钟内使用100个节点构建了117M个64维向量的索引。 设置为; // version: 0.1.4 // spark.executor.instances = 100 // spark.executor.memory = 8g // spark.driver.memory = 8g val fraction = 0.00086 // for about 100k samples val numTrees = 2 val numPartitions = 100 va

用户评论
请输入评论内容
评分:
暂无评论