k-means 聚类数据：如何标记新传入的数据

【问题标题】：k-means clustered data: how to label newly incoming datak-means 聚类数据：如何标记新传入的数据
【发布时间】：2019-07-26 01:47:21
【问题描述】：

我有一个带有由 k-means 聚类算法生成的标签的数据集。现在有一些来自另一个来源的数据（具有相同的数据结构），我想知道标记这些新的但看不见的数据的最明智的方法是什么？我正在考虑两者中的任何一个

计算与先前 k-means 质心的距离并相应地将数据标记到最近的质心
使用旧数据作为训练集对新数据运行新算法（例如 SVM）

很遗憾，我找不到任何关于这个特定问题的信息。关于 k-means 作为分类模型的一般用途，只有几个问题：

提前致谢。

乌力

【问题讨论】：

标签： machine-learning classification cluster-analysis k-means

【解决方案1】：

你不需要支持向量机的东西。第一种方法更方便。如果你使用 sklearn https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html 这里有一个例子。predict 函数会做你的工作。

【讨论】：

猜你喜欢

2017-09-01
2013-02-07
2019-12-27
2018-04-22
2021-12-10
2018-02-13
2016-04-04
2014-01-04
2018-10-02

相关资源

下载 2023-02-05
下载 2022-12-19
下载 2023-03-07

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode