【发布时间】:2010-10-12 18:03:41
【问题描述】:
我正在尝试优化一个基本上运行数百万次测试的软件。这些测试的生成方式可以有一些重复。当然,如果我能有效地避免它,我不想花时间运行我已经运行过的测试。
所以,我正在考虑使用 Bloom 过滤器来存储已经运行的测试。然而,布隆过滤器对我来说是不安全的。它给出了误报。也就是说,它可能会报告我已经运行了一个我没有运行过的测试。虽然这在我正在处理的场景中是可以接受的,但我想知道是否有与 Bloom 过滤器等效的方法,但在相反的方面犯了错误,即只给出假阴性。
我浏览了文献,没有任何运气。
【问题讨论】:
-
为了完整起见,这可能是有趣的:github.com/jmhodges/opposite_of_a_bloom_filter
-
有这样一个有趣的名字“布隆过滤器的反面”。代码:github.com/jmhodges/opposite_of_a_bloom_filter 博客:somethingsimilar.com/2012/05/21/the-opposite-of-a-bloom-filter
-
我希望他们把对面称为绽放 –> 霉菌过滤器!
标签: data-structures bloom-filter