【问题标题】:After using kmeans(): how to determine which point belongs to which group?使用kmeans()后:如何判断哪个点属于哪个组?
【发布时间】:2019-04-17 04:42:14
【问题描述】:

我正在运行 kmeans 聚类来识别标记数据。我运行了 pca,然后运行了 kmeans,并使用 ggbiplot 得到了以下图:

现在,我如何确定哪个点属于表格格式的哪个组。也就是说,在我的原始数据中,我想用它的组来标记每个点。

【问题讨论】:

  • 请包含可重现(样本)数据和代码以生成绘图。
  • 对我来说这看起来不像是好的集群...您是否试图表明它不适用于此数据?当投影显示只有 1 个集群时,为什么要使用 35 个集群?

标签: r cluster-analysis pca ggbiplot


【解决方案1】:

假设您的数据框的名称是 df 并且您想要 k 个集群。运行 k 表示函数后...

# K-Means CA
fit <- kmeans(df, k) # where k is the number of clusters

...您必须包含从适合您的数据框中生成的组

# add clusters to the dataframe
df$clusters <- fit$cluster
df
             a          b clusters
1  -0.96193342 -0.7447816        1
2  -0.29252572 -1.1312186        1
3   0.25878822 -0.7163585        1
4  -1.15213189  0.2526524        1
5   0.19578283  0.1520457        1
6   0.03012394 -0.3076564        1
7   0.08541773 -0.9530173        1
8   1.11661021 -0.6482428        2
9  -1.21885742  1.2243136        1
10  1.26736872  0.1998116        2

示例中使用的数据

set.seed(3)
n <- 10
k <- 2
df <- data.frame(a= rnorm(n), b= rnorm(n))

你也可以看看here

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-11-18
    • 1970-01-01
    • 2012-05-05
    • 1970-01-01
    • 2013-03-25
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多