【发布时间】:2012-06-19 23:24:55
【问题描述】:
我尝试将k-means 作为家庭作业。我的练习表给了我以下关于空中心的评论:
在迭代过程中,如果任何聚类中心没有与之关联的数据点,则将其替换为随机数据点。
这让我有点困惑,首先我读过的维基百科或其他来源根本没有提到这一点。我进一步阅读了“为您的数据选择一个好的 k”的问题 - 如果我开始为空的集群设置新的中心,我的算法应该如何收敛。
如果我忽略空集群,我会在 30-40 次迭代后收敛。忽略空簇是错误的吗?
【问题讨论】:
-
这是一个“最小”的一维可复制示例初始化:
{2, 3, 3, 3} {3, 7, 7, 7} {7, 8, 8, 8}。 (k=3) 第一次更新将清空中间簇!
标签: k-means