【发布时间】:2014-04-01 19:15:59
【问题描述】:
我已经为 20 维直方图实现了 k-means 聚类算法。它似乎在二维直方图上运行良好。
有时,误差平方和会在一次迭代后略微增加。这是正常现象,还是潜在错误的迹象?
如果可以增加 SSE,谁能提供一个我可以想象的例子?
【问题讨论】:
标签: cluster-analysis
我已经为 20 维直方图实现了 k-means 聚类算法。它似乎在二维直方图上运行良好。
有时,误差平方和会在一次迭代后略微增加。这是正常现象,还是潜在错误的迹象?
如果可以增加 SSE,谁能提供一个我可以想象的例子?
【问题讨论】:
标签: cluster-analysis
分配不得增加。
好像你在某个地方有错误。也许您使用的不是平方欧几里得距离?
SSE = 平方误差之和,而不是距离之和或其他基于距离的东西。
【讨论】:
SSE = sum_x min_c sum_d (x_d - c_d)^2 其中x 是数据点,c 是聚类中心,d 是维度。
sqrt,例如欧几里得距离,或者一个额外的平方项......如果我没记错的话,欧几里得距离的总和不是 k-means 总是减少:假设我有两个距离为 2 和 2 的对象。重新分配这些对象以使距离变为 4 和 1 会增加距离的绝对总和(从 4 到 5),但会减少平方和(17 至 8)。所以优化欧几里得距离和优化方差是不一样的。