【发布时间】:2015-03-10 04:24:42
【问题描述】:
我在我的数据集上使用 Scikit 聚类 kmeans。我正在使用 6 个集群,一切似乎都很好:
但是,在拟合 kmeans 之后,我立即在标签上进行分组并得到以下结果:
Length: 55003, dtype: int64
0 count 23110
1 count 1
2 count 10923
3 count 17949
4 count 1736
5 count 1284
我总是得到只有 1 个数据点的集群。如果我保存模型并在模型上再次预测数据,则预测本身也有一个数据点。那是怎么回事?这是 sci-kit 的错误吗?
【问题讨论】:
-
这很奇怪,你能发布你的数据吗?还有你用的是什么版本的numpy,sklearn?
标签: pandas scikit-learn cluster-analysis k-means