布隆过滤器是空间高效的概率数据结构,通过设想伯顿霍华德布卢姆于1970年,是用于测试一个是否元件是一个的成员组。可能会出现假阳性匹配,但否定否定匹配-换句话说,查询返回“可能在集合中”或“绝对不在集合中”。元素可以添加到集合中,但不能删除(尽管可以通过计数Bloom过滤器变体来解决);添加的项目越多,误报的可能性越大。 Bloom提出了一种应用技术,如果应用了“常规”的无错误哈希技术,则源数据量将需要不切实际的大量内存。他举了一个针对500,000个单词的字典的断字算法的示例,其中90%遵循简单的断字规则,但是其余的10%需要昂贵的磁盘访问来检索特定的断字模式。有了足够的核心内存,可以使用