【问题标题】:Kendall tau distance肯德尔 tau 距离
【发布时间】:2010-09-24 00:16:02
【问题描述】:

the wikipedia article 解释了 Kendall tau 编辑距离,但没有过多说明可能的应用。你什么时候或什么时候使用 tau 距离? 我正在寻找现实世界的例子,而不是发明的数学例子。

【问题讨论】:

  • 这个比编程更适用于统计。

标签: list comparison


【解决方案1】:

Kendall Tau 可用作比较搜索结果之间相似性的指标。例如,可以比较 Google 和 Bing 生成的前 10 个结果(对于同一查询)的接近程度。

【讨论】:

  • 你能举个例子吗
  • 假设你想衡量一个排名算法有多好。假设对象的正确排序顺序(由预言机给出)是:O(1,2,3,4,5)。现在,您运行排名算法 A,结果排名顺序为:A(1, 2, 3, 5, 4)。 Kendall Tau 允许您量化 A 产生的排名与预言机提供的排名的接近程度。直觉是它给出了一个人必须执行多少次交换才能将(在这个例子中)A变成O。
【解决方案2】:

通过查找元组之间的相似性进行分组。阅读“编程集体智能”以了解现实生活中的应用程序是什么样的。想想 Netflix。

【讨论】:

    【解决方案3】:

    我正在使用来自 YouTube 的一组视频元素。这些视频具有 cmets 数量或标题长度等功能。其中一些但不是全部具有平均评分或好恶。为了对这些做出质量声明,我查看了基本事实质量声明与其他特征之间的相关性。事实证明,存在一些显着的相关性,例如,评论数与平均评分相关。所以我可以假设视频的评论数量有利于其质量。

    Example from SciPy(将x1x2 视为comment_countrating_average):

    >>> x1 = [12, 2, 1, 12, 2]
    >>> x2 = [1, 4, 7, 1, 0]
    >>> tau, p_value = sp.stats.kendalltau(x1, x2)
    >>> tau
    -0.47140452079103173
    >>> p_value
    0.24821309157521476
    

    【讨论】:

      猜你喜欢
      • 2019-07-03
      • 1970-01-01
      • 1970-01-01
      • 2022-01-18
      • 2018-10-19
      • 1970-01-01
      • 1970-01-01
      • 2014-07-08
      • 1970-01-01
      相关资源
      最近更新 更多