【问题标题】:How to select closest representative to the center in each cluster in scipy-cluster?如何在 scipy-cluster 的每个集群中选择离中心最近的代表?
【发布时间】:2012-06-21 01:34:16
【问题描述】:

所以基本上,我使用 Python 模块 scipy-cluster 来绘制大量数据点。如果给定阈值或我想要的代表数量,是否有方法/功能可以给出每个集群的代表?理想情况下,每个代表必须与它所属的集群中心的距离最近。

编辑:我正在寻找每个集群中最接近质心的数据点。

【问题讨论】:

  • 你的问题不清楚;你需要说明。您是否在寻找最接近每个集群质心的数据点?
  • 是的,我就是这个意思。

标签: python cluster-analysis hierarchical-data hierarchical-clustering


【解决方案1】:

Scipy-cluster 为每个质心提供坐标并识别每个集群中的哪些点。一旦你有了它,我相信scipy.cluster.vq.py_vq 会给你观察和质心之间的距离。

【讨论】:

    【解决方案2】:

    我真的不知道我在 scipy-cluster 周围的方式,但听起来它给了你质心坐标。鉴于该信息和集群中哪些点的知识,计算集群中每个点与质心的距离应该很简单。只需确保您的计算基于用于聚类的相同距离度量(可能是欧几里德距离)。

    【讨论】:

    • scipy.cluster.vq.py_vq 将给出观测值和质心之间的距离。
    • @Aman,将来您应该考虑将这样的 cmets 作为单独的答案发布,因为这显然是 OP 正在寻找的。感谢您的贡献。
    猜你喜欢
    • 2019-05-16
    • 1970-01-01
    • 2021-05-02
    • 1970-01-01
    • 2013-09-10
    • 2019-05-06
    • 1970-01-01
    • 2017-04-11
    • 2020-11-15
    相关资源
    最近更新 更多