【发布时间】:2019-08-16 03:42:12
【问题描述】:
我有一个包含三个级别的分类变量(A、B 和 C)。
我还有一个连续变量,上面有一些缺失值。
我想将NA 值替换为其组的平均值。也就是说,A 组中缺失的观测值必须替换为A 组的平均值。
我知道我可以只计算每个组的平均值并替换缺失值,但我确信还有另一种方法可以通过循环更有效地做到这一点。
A <- subset(data, group == "A")
mean(A$variable, rm.na = TRUE)
A$variable[which(is.na(A$variable))] <- mean(A$variable, na.rm = TRUE)
现在,我知道我可以对组 B 和 C 执行相同的操作,但也许 for 循环(使用 if 和 else)可能会起作用?
【问题讨论】:
-
请创建一个最小的工作示例:stackoverflow.com/questions/5963269/…
标签: r loops missing-data imputation