【发布时间】:2014-03-04 09:29:17
【问题描述】:
我正在阅读 k-means 聚类和 k-medoid 聚类之间的区别。
据说在 k-medoid 算法中使用成对距离度量有一个优势,而不是更熟悉的平方和欧几里德距离类型度量来评估我们用 k-means 发现的方差。显然,这种不同的距离度量以某种方式减少了噪声和异常值。
我已经看到了这种说法,但我还没有看到任何关于这种说法背后的数学的好的推理。
是什么让 k-medoid 中常用的成对距离测量更好?更准确地说,缺少平方项如何使 k-medoids 具有与取中位数概念相关的理想属性?
【问题讨论】:
-
stats.stackexchange.com 可能是获得更深入和理论答案的更好地方。
-
查看我的更新答案,了解来自可靠统计数据的 细分点 的概念。中心点可能是一个稳健的统计量,平均值一点也不稳健。
标签: machine-learning cluster-analysis data-mining k-means