【问题标题】:R: Hierarchical clusteringR:层次聚类
【发布时间】:2015-08-12 02:15:48
【问题描述】:

假设我们有以下数据集

set.seed(144) 
dat <- matrix(rnorm(100), ncol=5)

以下函数创建所有可能的列组合并删除第一个

(combinations <- do.call(expand.grid, rep(list(c(F, T)), ncol(dat)))[-1,])
#     Var1  Var2  Var3  Var4  Var5
# 2   TRUE FALSE FALSE FALSE FALSE
# 3  FALSE  TRUE FALSE FALSE FALSE
# 4   TRUE  TRUE FALSE FALSE FALSE
# ...
# 31 FALSE  TRUE  TRUE  TRUE  TRUE
# 32  TRUE  TRUE  TRUE  TRUE  TRUE

最后一步是对每个列子集运行 k-means 聚类,这是 apply 的一个简单应用(我们希望每个 kmeans 模型中有 3 个聚类):

models <- apply(combinations, 1, function(x) kmeans(dat[,x], 3))

我的问题是如何为每个列子集运行分层聚类,而不是 kmeans。有什么想法吗?

【问题讨论】:

    标签: r cluster-analysis hierarchical-clustering hclust


    【解决方案1】:

    你可以使用 hclust

    models <- apply(combinations, 1, function(x) hclust(dist(dat[,x])))
    clusters <- apply(combinations, 1, function(x) cutree(hclust(dist(dat[,x])), k = 3))
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2018-10-04
      • 2014-06-28
      • 2013-05-08
      • 2021-02-04
      • 1970-01-01
      • 2018-10-22
      • 2016-08-07
      相关资源
      最近更新 更多