Scikit 聚类总是给出一个点聚类答案

【问题标题】：Scikit clustering always give one point clusterScikit 聚类总是给出一个点聚类
【发布时间】：2015-03-10 04:24:42
【问题描述】：

我在我的数据集上使用 Scikit 聚类 kmeans。我正在使用 6 个集群，一切似乎都很好：

但是，在拟合 kmeans 之后，我立即在标签上进行分组并得到以下结果：

Length: 55003, dtype: int64
0  count    23110
1  count        1
2  count    10923
3  count    17949
4  count     1736
5  count     1284

我总是得到只有 1 个数据点的集群。如果我保存模型并在模型上再次预测数据，则预测本身也有一个数据点。那是怎么回事？这是 sci-kit 的错误吗？

【问题讨论】：

【解决方案1】：

这是一个异常值。我从我的数据中删除了它，现在这些组是合适的。

【讨论】：