【发布时间】:2020-12-18 11:10:17
【问题描述】:
我想运行层次聚类分析。我知道 hclust() 函数,但不知道如何在实践中使用它;我一直坚持向函数提供数据并处理输出。
我想对给定测量进行聚类的主要问题。
我还想将层次聚类与 kmeans() 生成的聚类进行比较。同样,我不确定如何调用此函数或使用/操作它的输出。
我的数据类似于:
df<-structure(list(id=c(111,111,111,112,112,112), se=c(1,2,3,1,2,3),t1 = c(1, 2, 1, 1,1,3),
t2 = c(1, 2, 2, 1,1,4), t3 = c(1, 0, 0, 0,2,1), t4 = c(2, 5, 7, 7,1,2),
t5 = c(1, 0, 1, 1,1,1),t6 = c(1, 1, 1, 1,1,1), t7 = c(1, 1, 1 ,1,1,1), t8=c(0,0,0,0,0,0)), row.names = c(NA,
6L), class = "data.frame")
我想运行层次聚类分析来确定最佳聚类数。
如何根据预定义的测量值运行聚类 - 在这种情况下,例如对 2 号测量值进行聚类?
【问题讨论】:
标签: r dataframe hierarchical-clustering