【发布时间】:2014-02-08 08:27:56
【问题描述】:
我已阅读文档 here 以及查看 this 教程,但我仍然缺少在 scikit-learn 中使用 K-means 的基本知识:
假设我有一个这样的数据集:
|UserName| Variable1 | Variable2 | Variable3 | Cluster |
| bob | 1 | 3 | 7 | |
| joe | 2 | 4 | 8 | |
| bill | 1 | 6 | 4 | |
由于 K-means 采用一个 numpy 数组,我必须去掉用户名,只使用数值变量。但是,在创建集群之后,我如何将它们关联回每个单独的用户以进行进一步分析。即如何用相应的簇号填充“簇”列?
【问题讨论】:
标签: python numpy scikit-learn