【发布时间】:2019-05-16 09:07:31
【问题描述】:
在部署 K-means 算法后,我想从每个集群中的中心(基于欧几里得距离)获取 N 个最近的数据点。我可以使用
获取数据点的索引np.where(km.labels_ == 0)
【问题讨论】:
标签: python-3.x machine-learning scikit-learn cluster-analysis k-means
在部署 K-means 算法后,我想从每个集群中的中心(基于欧几里得距离)获取 N 个最近的数据点。我可以使用
获取数据点的索引np.where(km.labels_ == 0)
【问题讨论】:
标签: python-3.x machine-learning scikit-learn cluster-analysis k-means
您可以使用kmeans 类的transform 方法计算每个数据点到每个集群的距离。
然后假设您想要第 0 个索引 cluster 中的顶部 N 点,那么您可以这样做:
cluster = 0
N = 2
np.sort(kmeans.transform(X)[:,cluster])[:N]
【讨论】:
简单的四步流程:
argmin选择最小的k个
np.where的返回值将日落索引映射回数据集索引
【讨论】: