【发布时间】:2020-04-19 15:56:23
【问题描述】:
我使用 nltk 来执行 k 均值聚类,因为我想将距离度量更改为余弦距离。但是,如何获得所有簇的质心?
kclusterer = KMeansClusterer(8, distance = nltk.cluster.util.cosine_distance, repeats = 1)
predict = kclusterer.cluster(features, assign_clusters = True)
centroids = kclusterer._centroid
df_clustering['cluster'] = predict
#df_clustering['centroid'] = centroids[df_clustering['cluster'] - 1].tolist()
df_clustering['centroid'] = centroids
我正在尝试在 pandas 数据帧上执行 k 均值聚类,并希望每个数据点的聚类质心坐标位于数据帧列“质心”中。
提前谢谢你!
【问题讨论】: