【问题标题】:Passing distance matrix to k-means clustering in sklearn将距离矩阵传递给sklearn中的k-means聚类
【发布时间】:2017-09-16 16:35:29
【问题描述】:

根据sklearn kmeans documentation,它说 k-means 需要一个 shape=(n_samples, n_features) 的矩阵。但我提供了一个 shape=(n_samples,n_samples) 的距离矩阵,其中每个索引保存两个字符串之间的距离。时间序列已使用SAX 表示形式转换为字符串。

当我使用距离矩阵进行聚类时,它给出了很好的结果。这可能是什么原因?据我所知,K-medoids 是一种适用于距离矩阵的方法。

【问题讨论】:

    标签: python algorithm cluster-analysis k-means


    【解决方案1】:

    K-means,顾名思义,使用means

    计算算术平均值需要访问原始特征,不能使用距离矩阵。

    K-means 也不使用成对距离。所以距离矩阵对于这个算法是没有用的。

    请选择其他算法,例如层次聚类。

    【讨论】:

    • 什么算法支持这个?
    猜你喜欢
    • 2018-09-30
    • 2019-06-01
    • 2019-12-10
    • 2014-07-28
    • 2019-05-04
    • 2016-08-21
    • 2016-03-20
    • 2013-07-28
    • 2012-08-21
    相关资源
    最近更新 更多