【发布时间】:2014-01-07 07:22:27
【问题描述】:
我正在尝试对我的数据(100 行 x 130 列)运行包 NbClust 以确定我应该选择的集群数量,但如果我尝试将其应用于完整数据集,我会不断收到此错误:
> nc <- NbClust(mydata, distance="euclidean", min.nc=2, max.nc=99, method="ward",
index="duda")
[1] "There are only 100 nonmissing observations out of a possible 100 observations."
Error in NbClust(mydata, distance = "euclidean", min.nc = 2, max.nc = 99, :
The TSS matrix is indefinite. There must be too many missing values. The index cannot be calculated.
当我将该方法应用于 100x80 矩阵时,它确实产生了所需的输出(100x100 也给了我一个错误消息,但不同)。但是,显然,我想将此方法应用于整个数据集。 仅供参考 - 创建距离矩阵和使用 Ward 方法进行聚类都没有问题。距离矩阵和树状图都生成了……
【问题讨论】:
标签: r cluster-analysis