如何调整 K-means 聚类？答案

【问题标题】：How to adjust K-means clustering?如何调整 K-means 聚类？
【发布时间】：2013-04-28 02:08:07
【问题描述】：

我试图利用K-means clustering 方法来解决类似于维基百科的问题。

最小化簇内平方和 (WCSS)：

但在我的公式中，集群内的模块总和必须最小化。

给定整数集合 X 和簇数 k。需要选择 k 个簇整数 mu 的值，使得簇内差异模块的和最小化。

我以交互方式进行，随机选取初始 mu 值，然后将其调整为分配给集群的元素的平均值。

但是，这种方法只对简单的测试用例给出正确答案。

【问题讨论】：

“这种方法只对简单的测试用例给出正确答案”是什么意思？ K-means 方法如您所描述的那样工作：您在以下两个阶段之间循环，直到中心不再改变：1.您计算新的 mu 2.您将每个元素分配给最近的中心。
这个问题和Java有什么关系？
@user1368342，我希望它不会最小化正确的实用函数。维基文章指出，正方形被最小化。我的效用函数不一样。
使用什么实用功能并不重要。 @user1368342 描述的基本原理保持不变。当您计算每个点与集群质心的距离时，请使用您喜欢的任何距离度量 - 它不必是欧几里得距离。
@NikolayKuznetsov 目标函数是什么？能给个公式吗？

【解决方案1】：

“正确答案”是什么意思？ K-means 严格取决于初始条件（随机选择的初始平均中心）和数据分布。不能保证您总是获得相同的分布平均中心。

【讨论】：