【问题标题】:Database for a search engine搜索引擎的数据库
【发布时间】:2010-08-12 16:10:10
【问题描述】:

我正在考虑开发一个搜索引擎,但不知道我可以有效使用的后端。请建议我一个数据库,我可以在其中存储数千条记录并以高效的方式查询它们。我正在为自己的兴趣开发搜索引擎,所以请不要像通常在类似问题中发现的那样给我任何批评者的想法。

谢谢

【问题讨论】:

  • 一切都取决于您要搜索的内容。显然 Bono 使用的方法太慢了...bit.ly/54Dlbs
  • 为什么不使用像 Lucene 或类似的搜索引擎而不是构建一个?

标签: database search-engine


【解决方案1】:

看看Cloudant,它是Apache 的CouchDB 的集群/可扩展部署。 CouchDB 是 NoSQL 计划的一部分(它使用文件系统而不是由数据库服务器抽象存储)并且被告知可以很好地扩展,尤其是使用 Cloudant,尽管我自己还没有尝试过。

显然,对于任何 DODB(Apache 所说的面向文档的数据库),您将不得不将您的关注点从单纯的内存和表索引转移到包括存储容量,尽管使用文件系统意味着您通常能够使用更少的内存(因为更少的信息存储在内存中)。这是一个广泛的概括,但你明白了。

【讨论】:

    【解决方案2】:

    对于数千条记录,一个标准的 rdbms 就足够了。对于数百万人甚至更多,您可能需要寻找替代方案。

    但既然您是为了自己的利益而这样做,那么就各做一个,这样您就可以了解其中的差异。

    【讨论】:

      【解决方案3】:

      MySQL全文索引 是在数千条记录中搜索的理想解决方案。当您扩大规模并接近 100 万行时,MySQL 全文 会变慢,您将不得不使用另一种方法,例如 Sphinx

      【讨论】:

        猜你喜欢
        • 2017-07-23
        • 2011-06-06
        • 1970-01-01
        • 2010-12-26
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多