肯德尔 tau 距离答案

【问题标题】：Kendall tau distance肯德尔 tau 距离
【发布时间】：2010-09-24 00:16:02
【问题描述】：

the wikipedia article 解释了 Kendall tau 编辑距离，但没有过多说明可能的应用。你什么时候或什么时候使用 tau 距离？我正在寻找现实世界的例子，而不是发明的数学例子。

【问题讨论】：

这个比编程更适用于统计。

标签： list comparison

【解决方案1】：

Kendall Tau 可用作比较搜索结果之间相似性的指标。例如，可以比较 Google 和 Bing 生成的前 10 个结果（对于同一查询）的接近程度。

【讨论】：

你能举个例子吗
假设你想衡量一个排名算法有多好。假设对象的正确排序顺序（由预言机给出）是：O(1,2,3,4,5)。现在，您运行排名算法 A，结果排名顺序为：A(1, 2, 3, 5, 4)。 Kendall Tau 允许您量化 A 产生的排名与预言机提供的排名的接近程度。直觉是它给出了一个人必须执行多少次交换才能将（在这个例子中）A变成O。

【解决方案2】：

通过查找元组之间的相似性进行分组。阅读“编程集体智能”以了解现实生活中的应用程序是什么样的。想想 Netflix。

【讨论】：

【解决方案3】：

我正在使用来自 YouTube 的一组视频元素。这些视频具有 cmets 数量或标题长度等功能。其中一些但不是全部具有平均评分或好恶。为了对这些做出质量声明，我查看了基本事实质量声明与其他特征之间的相关性。事实证明，存在一些显着的相关性，例如，评论数与平均评分相关。所以我可以假设视频的评论数量有利于其质量。

Example from SciPy（将x1 和x2 视为comment_count 和rating_average）：

>>> x1 = [12, 2, 1, 12, 2]
>>> x2 = [1, 4, 7, 1, 0]
>>> tau, p_value = sp.stats.kendalltau(x1, x2)
>>> tau
-0.47140452079103173
>>> p_value
0.24821309157521476

【讨论】：