【发布时间】:2021-12-26 09:41:33
【问题描述】:
这是一个非常基本且愚蠢的怀疑。我读过,为了防止在 TREC 比赛中进行大型相关性评估 (reference),排名靠前的文件 参与系统返回的数据被汇集起来,以创建用于相关性评估的文档集。但是,我的疑问是:
如果大多数系统使用通用模型或具有相同参数的类似模型。例如,如果多个系统使用 LSA,其 rank 减少到 100,120,150,105 等。那么有两个问题。第一,合并这些结果可能不会真正给出与每个查询相关的文档,因为返回的文档可能会严重重叠。第二,根据参与系统使用的模型,要评估的文件实际上是有偏差的。因此,相关性判断不会真正与方法无关。
我知道我在这里遗漏了一些东西,如果有人可以指导我找到丢失的链接,那将非常有帮助!
【问题讨论】:
标签: full-text-search information-retrieval data-retrieval relevance lsa