【发布时间】:2018-10-24 06:13:36
【问题描述】:
我有一个带有(标记)集群的数据集。我试图找到每个集群的质心(一个距离集群所有数据点的距离最小的向量)。
我找到了许多执行聚类的解决方案,然后才找到质心,但我还没有找到现有的。
Python schikit-learn 是首选。谢谢。
【问题讨论】:
-
你有什么代码可以证明你已经尝试过吗?通常,为了找到集群质心,您只需对集群中的所有示例取特征向量的平均值。 Pandas-esk 示例
df.groupby("cluster").mean() -
检查this。
KMeans的属性之一是cluster_centers_ -
@KenSyme 我一开始就是这样做的,但我的主管说他不想这样做。
-
请说明您尝试了哪些方法以及遇到了哪些困难?如果您不确定从哪里开始,那么 SO 不是这个地方。 Start here
-
@ninesalt 我看到了,但我的数据已经被标记,我不想执行 kmeans
标签: python machine-learning scikit-learn centroid