【发布时间】:2016-05-05 01:09:09
【问题描述】:
我正在使用这个简单的脚本来使用 sci-kit learn 对数据进行聚类
from sklearn.cluster import KMeans
import pandas as pd
import matplotlib.pyplot as plt
X = pd.read_csv('TestData.csv')
est = KMeans(n_clusters=10)
Y = pd.DataFrame(est.fit_predict(X))
frames = [X,Y]
Out = pd.concat(frames, axis = 1)
这给了我以下输出:
(feat1) (feat2) (cluster ID)
0 0.866 1124.182 9
1 2.078 2688.612 1
2 0.000 0.000 0
3 0.000 0.000 0
4 1.038 1344.306 6
5 2.388 3090.338 5
6 0.580 749.456 8
7 1.556 2016.456 2
我还想显示每个集群的质心,以便输出如下所示:
(feat1) (feat2) (cluster ID) (centroid 1) (centroid 2)
0 0.866 1124.182 9
1 2.078 2688.612 1
2 0.000 0.000 0
3 0.000 0.000 0
4 1.038 1344.306 6
5 2.388 3090.338 5
6 0.580 749.456 8
7 1.556 2016.456 2
我尝试使用 est.cluster_centers_
但这没有用。
如何获得正确的聚类中心?
【问题讨论】:
-
试试
kmeans.cluster_centers_
标签: python scikit-learn k-means