【问题标题】:A few Q's about Bloom Filter implementation关于布隆过滤器实现的几个问题
【发布时间】:2009-10-20 15:02:04
【问题描述】:

我最近发现了一个设置某些代码 kata 的网站。

其中一个 Kata 引起了我的注意,让我开始研究 Bloom 过滤器。

我正在使用 PHP 和 MySql。

我有一个包含大约 45,000 个单词的表作为字典,我已经编写了代码来创建一个布隆过滤器数组。

我的问题是……

  1. 代码应该在什么时候运行来创建布隆过滤器数组 a) 当用户访问页面时 b) 每次运行搜索 c) 我只做一次,然后储存起来以备将来使用 d) 完全不同的东西

  2. 我应该如何存储数组 a) 将其保存在数组中 b) 写入文本文件 c) 创建一个新表并将其存储在那里 d) 完全不同的东西

任何有布隆过滤器经验的人的帮助都会很有帮助。

干杯 挂火

【问题讨论】:

    标签: data-structures language-agnostic bloom-filter


    【解决方案1】:

    1) c(也许,在会话中)。

    2) 一个(在内存中)。

    对于仅 45,000 个单词,您可能可以将整个列表保存在内存哈希中,并且仍然可以快速查找。可能不需要布隆过滤器。

    -- 豪尔赫。

    【讨论】:

    • 感谢 Jorge 的回复,我以为我的帖子已经消失在时间的迷雾中了。您是否碰巧知道任何关于哈希函数和列表实际使用的好文章/教程?这是一个我需要振作起来但又要回避的领域。问候 Hangfire
    • 在 SO 上问这个问题 :) 而不是 cmets。
    • 顺便说一句:我认为这是一篇很好的 BLOOM FILTER 文章:perl.com/pub/a/2004/04/08/bloom_filters.html 这不是 PHP,但应该仍然有意义。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-06-15
    • 1970-01-01
    • 1970-01-01
    • 2016-06-28
    • 1970-01-01
    • 2012-05-12
    • 2010-09-23
    相关资源
    最近更新 更多