【发布时间】:2012-05-30 01:57:13
【问题描述】:
我惊讶地发现来自library(cluster) 的clara 允许 NA。但是函数文档没有说明它如何处理这些值。
所以我的问题是:
-
clara如何处理 NA? - 这可以以某种方式用于
kmeans(不允许Nas)吗?
[更新]所以我确实在clara函数中找到了几行代码:
inax <- is.na(x)
valmisdat <- 1.1 * max(abs(range(x, na.rm = TRUE)))
x[inax] <- valmisdat
用valmisdat 进行缺失值替换。不确定我是否理解使用这种公式的原因。有任何想法吗?按每列分别处理 NA 是否更“自然”,也许用均值/中位数代替?
【问题讨论】:
标签: r cluster-analysis