【发布时间】:2021-05-02 07:50:33
【问题描述】:
我有一个相对较大的图,它有大约 6000 个顶点,我必须使用 KMeans 来查看 5467 个簇是什么。我必须使用不同的指标,这就是为什么我将 distance_matrix 作为输入。这样做的问题是,由于 n_clusters 太大,它不会收敛。有人建议我进行自定义调整以使其正常工作,但我不确定这意味着什么。这就是为什么我在这里发布这个问题。欢迎任何帮助!谢谢! 这是我的代码:
from sklearn.cluster import KMeans
distance_matrix = floyd_warshall_numpy(G)
cluster = KMeans(n_clusters=5467)
cluster.fit(distance_matrix)
graph_labels = cluster.labels_
【问题讨论】:
标签: python cluster-analysis k-means