改进的局部敏感哈希算法用于近似最近邻问题
近年来,最近邻搜索(NNS)问题已在各种有趣的应用中得到了广泛应用。局部敏感哈希(LSH)是一种解决近似最近邻问题的流行算法,被证明是解决NNS的一种有效方法。高维和大规模数据库中的问题。 在p稳定LSH方案的基础上,提出了一种基于p稳定LSH的改进算法,称为基于随机性的局部敏感哈希(RLSH)。 我们提出的算法修改了查询策略,即它随机选择某个哈希表来投影查询点,而不是在最近邻居查询期间将查询点映射到所有哈希表中,并重建候选点以查找最近邻居。 这种改进策略可确保RLSH花费比p稳定LSH算法更少的时间搜索最近的邻居,以保持较高的召回率。 此外,该策略被证明即使在哈希表较少的情况下也能促进候选点的多样性。 在合成数据集和开放数据集上执行实验。 结果表明,在平衡相同召回率的同时,我们的方法比p稳定LSH可以花费更少的时间消耗和更少的空间需求。
暂无评论