【发布时间】:2013-04-28 02:08:07
【问题描述】:
我试图利用K-means clustering 方法来解决类似于维基百科的问题。
最小化簇内平方和 (WCSS):
但在我的公式中,集群内的模块总和必须最小化。
给定整数集合 X 和簇数 k。需要选择 k 个簇整数 mu 的值,使得簇内差异模块的和最小化。
我以交互方式进行,随机选取初始 mu 值,然后将其调整为分配给集群的元素的平均值。
但是,这种方法只对简单的测试用例给出正确答案。
【问题讨论】:
-
“这种方法只对简单的测试用例给出正确答案”是什么意思? K-means 方法如您所描述的那样工作:您在以下两个阶段之间循环,直到中心不再改变:1.您计算新的 mu 2.您将每个元素分配给最近的中心。
-
这个问题和Java有什么关系?
-
@user1368342,我希望它不会最小化正确的实用函数。维基文章指出,正方形被最小化。我的效用函数不一样。
-
使用什么实用功能并不重要。 @user1368342 描述的基本原理保持不变。当您计算每个点与集群质心的距离时,请使用您喜欢的任何距离度量 - 它不必是欧几里得距离。
-
@NikolayKuznetsov 目标函数是什么?能给个公式吗?
标签: algorithm cluster-analysis