【发布时间】:2010-04-17 16:33:39
【问题描述】:
如果我们想在倒排索引结构中搜索“t1 t2 t3”(t1,t2,t3 必须排队)这样的查询, 我们应该怎么做?
1-首先我们搜索 "t1" 词并找到所有包含 "t1" 的文档,然后对 "t2" 和 "t3" 进行这项工作。然后找到“t1”、“t2”和“t3”位置相邻的文档。
2-首先我们搜索“t1”这个词并找到所有包含“t1”的文档,然后在我们找到的所有文档中,我们搜索“t2”,接下来,在这个结果中,我们找到了包含“t3”。
我有一个完整的倒排索引。我想知道上面哪些方式是优化的,(1)还是(2)?
非常感谢。
【问题讨论】:
标签: search phrase inverted-index