【发布时间】:2017-09-16 16:35:29
【问题描述】:
根据sklearn kmeans documentation,它说 k-means 需要一个 shape=(n_samples, n_features) 的矩阵。但我提供了一个 shape=(n_samples,n_samples) 的距离矩阵,其中每个索引保存两个字符串之间的距离。时间序列已使用SAX 表示形式转换为字符串。
当我使用距离矩阵进行聚类时,它给出了很好的结果。这可能是什么原因?据我所知,K-medoids 是一种适用于距离矩阵的方法。
【问题讨论】:
标签: python algorithm cluster-analysis k-means