probminhash:ProbMinHash –用于(概率)Jaccard相似度的一类局部敏感哈希算法 源码
ProbMinHash –用于(概率)Jaccard相似度的一类局部敏感哈希算法 带有标签的修订版用于生成最终论文中提出的结果,该论文可在上获得,或在以下网站上找到arXiv-preprint: 。 除了在本文所提出的算法, 包含算法NonStreamingProbMinHash2和NonStreamingProbMinHash4 ,其非流的等价变体ProbMinHash2和ProbMinHash4 。 在第一遍中,他们计算所有权重的总和,从而确定最终止损极限的分布。 这允许预先估计适当的停止极限。 例如,如果停止极限被初始化为该分布的第90个百分位数,则即使对于停止极限本来可以无限的第一
文件列表
probminhash:ProbMinHash –用于(概率)Jaccard相似度的一类局部敏感哈希算法
(预估有个256文件)
buffer_size_test_result_1024_1000000.dat
457KB
buffer_size_test_result_1024_500000.dat
457KB
buffer_size_test_result_4096_50000.dat
469KB
buffer_size_test_result_4096_100000.dat
469KB
buffer_size_test_result_1024_100000.dat
456KB
buffer_size_test_result_4096_10000.dat
469KB
buffer_size_test_result_1024_50000.dat
456KB
buffer_size_test_result_1024_200000.dat
457KB
buffer_size_test_result_4096_1000000.dat
516KB
buffer_size_test_result_4096_500000.dat
508KB
暂无评论