【问题标题】:How to adjust K-means clustering?如何调整 K-means 聚类?
【发布时间】:2013-04-28 02:08:07
【问题描述】:

我试图利用K-means clustering 方法来解决类似于维基百科的问题。

最小化簇内平方和 (WCSS):

但在我的公式中,集群内的模块总和必须最小化。

给定整数集合 X 和簇数 k。需要选择 k 个簇整数 mu 的值,使得簇内差异模块的和最小化。

我以交互方式进行,随机选取初始 mu 值,然后将其调整为分配给集群的元素的平均值。

但是,这种方法只对简单的测试用例给出正确答案。

【问题讨论】:

  • “这种方法只对简单的测试用例给出正确答案”是什么意思? K-means 方法如您所描述的那样工作:您在以下两个阶段之间循环,直到中心不再改变:1.您计算新的 mu 2.您将每个元素分配给最近的中心。
  • 这个问题和Java有什么关系?
  • @user1368342,我希望它不会最小化正确的实用函数。维基文章指出,正方形被最小化。我的效用函数不一样。
  • 使用什么实用功能并不重要。 @user1368342 描述的基本原理保持不变。当您计算每个点与集群质心的距离时,请使用您喜欢的任何距离度量 - 它不必是欧几里得距离。
  • @NikolayKuznetsov 目标函数是什么?能给个公式吗?

标签: algorithm cluster-analysis


【解决方案1】:

“正确答案”是什么意思? K-means 严格取决于初始条件(随机选择的初始平均中心)和数据分布。不能保证您总是获得相同的分布平均中心。

【讨论】:

  • 是的,我知道我并不总是收敛到最优解。所以我运行它 500/1000 次并选择最佳值。
猜你喜欢
  • 2020-09-10
  • 2015-04-11
  • 2011-08-13
  • 2013-08-08
  • 2013-02-14
  • 2018-01-14
  • 2020-09-11
  • 2011-04-11
  • 2016-12-16
相关资源
最近更新 更多