【发布时间】:2019-07-26 01:47:21
【问题描述】:
我有一个带有由 k-means 聚类算法生成的标签的数据集。现在有一些来自另一个来源的数据(具有相同的数据结构),我想知道标记这些新的但看不见的数据的最明智的方法是什么?我正在考虑两者中的任何一个
- 计算与先前 k-means 质心的距离并相应地将数据标记到最近的质心
- 使用旧数据作为训练集对新数据运行新算法(例如 SVM)
很遗憾,我找不到任何关于这个特定问题的信息。关于 k-means 作为分类模型的一般用途,只有几个问题:
提前致谢。
乌力
【问题讨论】:
标签: machine-learning classification cluster-analysis k-means