【发布时间】:2026-01-15 22:30:01
【问题描述】:
我正在尝试编写一些代码来制作一个用于从文件中搜索文本的小型应用程序。
文件应该被爬取,我需要放置一个倒排索引来增加搜索量。
我的问题是我对解析器的样子有点想法;我愿意在查询中实现 AND、NOT 或 OR。
然而,我无法弄清楚我的索引应该如何......我从未创建过倒排索引,所以如果有人能提出可行的方法来做这件事,我将不胜感激。我在理论上知道它是如何工作的,但我的问题是我完全不知道如何在 MySql 中实现。我也需要给被索引的关键字一个权重。
【问题讨论】:
-
您需要手动执行此操作,还是可以使用现有的解决方案,例如 Lucene (lucene.apache.org)?
标签: search-engine inverted-index