【发布时间】:2017-06-28 10:15:24
【问题描述】:
我正在尝试使用 R 中的 NbClust 方法来确定聚类分析中的最佳聚类数量,遵循Manning 书中的方法。 但是,我收到一条错误消息:
hclust 中的错误(md, method = "average"): must have n >= 2 objects to 集群。
即使 hclust 方法似乎有效。因此,我认为问题是(错误消息也说明了这一点),NbClust 试图创建内部只有一个对象的组。
这是我的代码:
mydata = read.table("PLR_2016_WM_55_5_Familienstand_aufbereitet.csv", skip = 0, sep = ";", header = TRUE)
mydata <- mydata[-1] # Without first line (int)
data.transformed <- t(mydata) # Transformation of matrix
data.scale <- scale(data.transformed) # Scaling of table
data.dist <- dist(data.scale) # Calculates distances between points
fit.average <- hclust(data.dist, method = "average")
plot(fit.average, hang = -1, cex = .8, main = "Average Linkage Clustering")
library(NbClust)
nc <- NbClust(data.scale, distance="euclidean",
min.nc=2, max.nc=15, method="average")
我发现了类似的问题here,但我无法调整代码。
【问题讨论】:
标签: r grouping cluster-analysis hclust