【发布时间】:2020-03-31 07:24:03
【问题描述】:
我有一个大型医疗数据框,我想将其用于机器学习。因此,我必须估算缺失值。对于连续变量,我想输入中值,如下所示:
dat$First_Wbc <- ifelse(is.na(dat$First_Wbc), median2(dat$First_Wbc), dat$First_Wbc)
我想使用 mutate_at 创建一个与我上面提供的代码相同的代码,但一次用于多个变量。我知道这是可能的,但到目前为止我还无法正确格式化它。 你能帮帮我吗?
注意:median2() 是一个与 median() 相同的函数,但它忽略了缺失值
【问题讨论】: