【发布时间】:2016-09-22 09:46:21
【问题描述】:
我在学校有一个项目,我需要使用倒排索引创建一个搜索引擎,但我有点不知道如何继续。
我使用倒排文件索引存储了我的文档(4 个文档)中的所有单词,但在某种程度上,特定文件中的每个单词都有一行,所以假设单词“like”可以出现在文档 2 三中times 和 doc 4 两次 - 所以它将有 2 行, word:like docid:2 hit:3 instoplist:0 和 word:like docid:4 hit:2 instopelist:0 (hit 是单词出现在doc 和 instoplist,如果它是停止列表中单词的一部分)。
现在我需要能够对该索引进行查询。 假设我需要找到 - 汽车和(摩托车或自行车) 这是最好的方法吗?我如何写搜索的顺序?我怎么知道先骑摩托车和自行车,然后在它们之间做“或”,然后用汽车做“和”?
*ps- 使用php编写代码
我将不胜感激,
谢谢
【问题讨论】:
标签: search-engine querying inverted-index