【发布时间】:2018-08-10 02:15:55
【问题描述】:
我正在尝试学习如何用计算值替换一个变量中的缺失数据。
我的数据集 (bk3) 看起来像:
ign: 80, 96, 75, 66, 53
Mean: 26, 24, 27, 34, 41
sd: 6, 7, NA, 8, 4
lci: 24, 25, 20, 32, 38
uci: 29, 26, 29, 33, 43
输入:
bk3 <- structure(list(ign = c(80L, 96L, 75L, 66L, 53L), mean = c(26L, 24L,
27L, 34L, 41L), sd = c(6L, 7L, NA, 8L, 4L), lci = c(24L, 25L, 20L,
32L, 38L), uci = c(29L, 26L, 29L, 33L, 43L)), .Names = c("ign",
"mean", "sd", "lci", "uci"), class = "data.frame", row.names = c(NA, -5L))
基本上,我使用 95% 置信区间(uci、lci)和样本 n(ign)来计算缺失的 SD(sd)。
我尝试使用的代码是:
bk3$sd[is.na(bk3$sd)] <- (bk3$uci - bk3$lci) * sqrt(bk3$ign)/3.92
但我收到以下警告消息:
“要替换的项目数不是替换长度的倍数”
更新:我正在尝试创建一个函数,如果提供了适当的变量,它将自动执行此操作。我尝试将其设置为以下格式:
fillsd <- function(x, n, u, l)
{
i1 <- is.na(x)
i2 <- n > 59
x[i1 & i2] <- with(df, (u[i1 & i2] - l[i1 & i2]) * (sqrt(n[i1 &
i2])/3.92)) }
虽然函数“fillsd”似乎已正确保存在我的全局环境中,但当我尝试将它与以下代码一起使用时它不起作用:
fillsd(x="bk3$sd", n="bk3$ign", u="bk3$uci", l="bk3$lci")
该代码没有产生错误消息,但该函数似乎也没有做任何事情。这是我处理的第一个函数,我无法找到可比较的示例来知道代码的哪一部分是不正确的。如果您对如何完成这项工作有任何想法,请告诉我。谢谢!
【问题讨论】:
-
对不起,我是新手。这是使用 dput 的输出: structure(list(ign = c(80L, 96L, 75L, 66L, 53L), mean = c(26L, 24L, 27L, 34L, 41L), sd = c(6L, 7L, NA , 8L, 4L), lci = c(24L, 25L, 20L, 32L, 38L), uci = c(29L, 26L, 29L, 33L, 43L)), .Names = c("ign", "mean", "sd", "lci", "uci"), class= "data.frame", row.names = c(NA, -5L))
-
没关系。我在下面发布了一个解决方案。你可以检查这是否是你想要的
-
您好 akrun,再次感谢您对我的问题的答复。我忘记了我只需要完成对 ign 值 >59 的计算,并且对于小于或等于 60 的 ign 值有一个单独的计算。我正在尝试复制 STATA 命令“如果 ign>59”。我一直在到处寻找模拟,但似乎找不到这么简单的。我尝试创建 ifelse 语句无济于事。你知道怎么做吗?再次感谢。
-
不完全清楚您的问题。也许
i2 <- bk3$ign > 59然后将其也用作索引,即with(bk3, (ici[i1 & i2] - lci[i1 & i2] * sort(ign[i1 & i2])/3.92) -
你能在你的帖子中更新它吗?从 cmets 不清楚
标签: r missing-data