【问题标题】:How to select the most k distant elements如何选择最多 k 个不同的元素
【发布时间】:2020-03-20 15:14:46
【问题描述】:

我的部分研究是选择 n 个元素中距离最远的 k 个元素。假设以下示例:

      T1   T2   T3   T4   T5
T1    -    5    2    7    3
T2    5    -    6    2    8
T3    2    6    -    9    1
T4    7    2    9    -    4
T5    3    8    1    4    -

我想选择三个最远的元素。注意每个数字代表任意两个元素之间的距离,比如T1和T2之间的距离是5。

我想到的一种方法是对每个元素的距离求和,并在此基础上选择最高的三个总和值。将其应用于上面显示的示例会导致:

T1    T2    T3    T4    T5
17    21    18    22    16

基于此,最远的三个元素是 T4、T2 和 T3。

你认为选择 k 最远元素的正确方法是什么,或者有更好的方法吗?

【问题讨论】:

  • 如果您认为最远的元素是与所有其他元素的距离之和最大的元素,那么您的方法似乎还可以。
  • @Daniel 是否可以在我的情况下应用贪心算法?
  • 你应该详细说明你所谓的最遥远的元素。使用您的算法,您可以选择远离所有其他元素的元素,但所选元素可能彼此非常接近。有问题吗?
  • @Damien 不,这不是问题。基本上,我想知道一种方法来找出一个元素与其他元素的距离。我有兴趣找到那些与其他元素最远的元素。现在清楚了吗?

标签: algorithm


【解决方案1】:

这个问题的答案取决于你所说的“最遥远”是什么意思。这又取决于您的研究应用。不知道这一点,我什至无法建议您使用适当的定义。或者甚至是关于你是否正在以一种有用的方式思考它。其他人也不能。

(尽管https://en.wikipedia.org/wiki/Curse_of_dimensionality 值得关注。如果它以任何方式适用,你的直觉很可能会误导你。)

【讨论】:

  • 你能看看我给 Damien 的回复吗?
  • @AdamAmin 你想要最大化距离的总和吗?中间距离最大化?你想找到一组“平均元素”,并找到看起来尽可能少的那个组的东西吗?这些都是你可以指的合理的事情,而你真正想要哪一个很大程度上取决于你的研究问题是什么。
  • 为了解释研究问题,每个元素都是一个测试用例,任意两个测试用例之间的距离是根据它们的陈述的差异计算的汉明距离。距离越大,两个测试用例的语句差异越大。
猜你喜欢
  • 2018-09-21
  • 2021-08-29
  • 2020-12-28
  • 1970-01-01
  • 1970-01-01
  • 2019-06-24
  • 2019-08-13
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多