【发布时间】:2012-03-11 00:47:26
【问题描述】:
编辑: 由于每个人都感到困惑,我想简化我的问题。我有两个有序列表。现在,我只想计算一个列表与另一个列表的相似程度。
例如,
1,7,4,5,8,9
1,7,5,4,9,6
什么是衡量这两个列表之间相似性的好方法,所以顺序很重要。例如,我们应该惩罚相似性,因为在两个列表中交换了 4,5?
我有 2 个系统。一个最先进的系统和一个我实施的系统。给定一个查询,两个系统都返回一个排序的文档列表。现在,我想比较我的系统和“最先进的系统”之间的相似性,以衡量我的系统的正确性。请注意,文件的顺序很重要,因为我们正在讨论排名系统。 有谁知道任何可以帮助我找到这两个列表之间相似性的措施。
【问题讨论】:
-
您是否假设“最先进的系统”返回的文档是好的?或者你想测试你的系统是否比“最先进的”更好?如果第二个:你的判断是什么?您如何评估查询是否确实相关?
-
@amit:我假设最先进的系统返回的文档是好的。假设顺序非常重要,我想计算我的结果与它的相似程度
-
@amit:你为什么要删除你的答案?
-
我认为它不符合您的需要,目前正在改进
-
我认为您应该重新表述您的问题,因为每个人在阅读您的问题后都会得出相同的结论,即每次您要求人们重新阅读您的问题时,这意味着您的问题有问题问题。所以请详细说明一下。
标签: algorithm search statistics probability information-retrieval