【问题标题】:Generating random clusters' centers with max distance生成具有最大距离的随机簇的中心
【发布时间】:2019-02-18 00:48:36
【问题描述】:

我有一个顺序数据(每次一个实例)要聚集成两个类。我想为此任务使用 K-means 的顺序版本(sequential K-means)。

在开始时为算法随机指定两个集群的中心时,我希望它们之间的距离尽可能大(即彼此相距很远),这样得到的两个集群的分布不会受到初始中心的影响。

我的想法对吗?如果是这样,我该怎么做?

【问题讨论】:

  • 也许您可以提供有关您的数据以及您想要实现的目标的更多详细信息,因为我认为我并不完全理解。 K-Means 将尝试将您的数据分成大小相等的集群,并假设平均值将收敛到集群的中心。也许另一种算法会更合适?
  • 我对问题做了一些修改,希望现在清楚

标签: cluster-analysis k-means


【解决方案1】:

宁可尝试最好地估计真实均值。这是最佳策略。

如果你只是想让它们相距很远,那可能会导致它们之间的点分配不当。

【讨论】:

    猜你喜欢
    • 2021-10-15
    • 2018-04-12
    • 1970-01-01
    • 1970-01-01
    • 2013-01-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多