将距离矩阵传递给sklearn中的k-means聚类答案

【问题标题】：Passing distance matrix to k-means clustering in sklearn将距离矩阵传递给sklearn中的k-means聚类
【发布时间】：2017-09-16 16:35:29
【问题描述】：

根据sklearn kmeans documentation，它说 k-means 需要一个 shape=(n_samples, n_features) 的矩阵。但我提供了一个 shape=(n_samples,n_samples) 的距离矩阵，其中每个索引保存两个字符串之间的距离。时间序列已使用SAX 表示形式转换为字符串。

当我使用距离矩阵进行聚类时，它给出了很好的结果。这可能是什么原因？据我所知，K-medoids 是一种适用于距离矩阵的方法。

【问题讨论】：

标签： python algorithm cluster-analysis k-means

【解决方案1】：

K-means，顾名思义，使用means。

计算算术平均值需要访问原始特征，不能使用距离矩阵。

K-means 也不使用成对距离。所以距离矩阵对于这个算法是没有用的。

请选择其他算法，例如层次聚类。

【讨论】：

什么算法支持这个？