【问题标题】:k-means clustered data: how to label newly incoming datak-means 聚类数据:如何标记新传入的数据
【发布时间】:2019-07-26 01:47:21
【问题描述】:

我有一个带有由 k-means 聚类算法生成的标签的数据集。现在有一些来自另一个来源的数据(具有相同的数据结构),我想知道标记这些新的但看不见的数据的最明智的方法是什么?我正在考虑两者中的任何一个

  • 计算与先前 k-means 质心的距离并相应地将数据标记到最近的质心
  • 使用旧数据作为训练集对新数据运行新算法(例如 SVM)

很遗憾,我找不到任何关于这个特定问题的信息。关于 k-means 作为分类模型的一般用途,只有几个问题:

提前致谢。

乌力

【问题讨论】:

    标签: machine-learning classification cluster-analysis k-means


    【解决方案1】:

    你不需要支持向量机的东西。第一种方法更方便。如果你使用 sklearn https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html 这里有一个例子。predict 函数会做你的工作。

    【讨论】:

      猜你喜欢
      • 2017-09-01
      • 2013-02-07
      • 2019-12-27
      • 2018-04-22
      • 2021-12-10
      • 2018-02-13
      • 2016-04-04
      • 2014-01-04
      • 2018-10-02
      相关资源
      最近更新 更多