【发布时间】:2010-09-24 00:16:02
【问题描述】:
the wikipedia article 解释了 Kendall tau 编辑距离,但没有过多说明可能的应用。你什么时候或什么时候使用 tau 距离? 我正在寻找现实世界的例子,而不是发明的数学例子。
【问题讨论】:
-
这个比编程更适用于统计。
标签: list comparison
the wikipedia article 解释了 Kendall tau 编辑距离,但没有过多说明可能的应用。你什么时候或什么时候使用 tau 距离? 我正在寻找现实世界的例子,而不是发明的数学例子。
【问题讨论】:
标签: list comparison
Kendall Tau 可用作比较搜索结果之间相似性的指标。例如,可以比较 Google 和 Bing 生成的前 10 个结果(对于同一查询)的接近程度。
【讨论】:
通过查找元组之间的相似性进行分组。阅读“编程集体智能”以了解现实生活中的应用程序是什么样的。想想 Netflix。
【讨论】:
我正在使用来自 YouTube 的一组视频元素。这些视频具有 cmets 数量或标题长度等功能。其中一些但不是全部具有平均评分或好恶。为了对这些做出质量声明,我查看了基本事实质量声明与其他特征之间的相关性。事实证明,存在一些显着的相关性,例如,评论数与平均评分相关。所以我可以假设视频的评论数量有利于其质量。
Example from SciPy(将x1 和x2 视为comment_count 和rating_average):
>>> x1 = [12, 2, 1, 12, 2]
>>> x2 = [1, 4, 7, 1, 0]
>>> tau, p_value = sp.stats.kendalltau(x1, x2)
>>> tau
-0.47140452079103173
>>> p_value
0.24821309157521476
【讨论】: