【问题标题】:Inverted index in a search engine搜索引擎中的倒排索引
【发布时间】:2026-01-15 22:30:01
【问题描述】:

我正在尝试编写一些代码来制作一个用于从文件中搜索文本的小型应用程序。

文件应该被爬取,我需要放置一个倒排索引来增加搜索量。

我的问题是我对解析器的样子有点想法;我愿意在查询中实现 AND、NOT 或 OR。

然而,我无法弄清楚我的索引应该如何......我从未创建过倒排索引,所以如果有人能提出可行的方法来做这件事,我将不胜感激。我在理论上知道它是如何工作的,但我的问题是我完全不知道如何在 MySql 中实现。我也需要给被索引的关键字一个权重。

【问题讨论】:

  • 您需要手动执行此操作,还是可以使用现有的解决方案,例如 Lucene (lucene.apache.org)?

标签: search-engine inverted-index


【解决方案1】:

这是一个简单的实现。 http://rosettacode.org/wiki/Inverted_Index

【讨论】:

    【解决方案2】:

    选择 1:Apache Solr/Lucene。选择2:mysql的全文索引支持。

    【讨论】: