【发布时间】:2017-03-08 09:20:43
【问题描述】:
我的数据集中有部分重复的行。这些行在两个变量上匹配,然后对于其余的变量,有一些 NA。如果我可以将这对部分重复的行组合起来,我就会为该行提供一个完整的案例。
如何根据两个变量的相似值组合数据集中的行,从而替换每个单独行中的 NA,留下一个完整的行?
a <- (c(1, 1, 1, 1))
b <- (c(1, 1, 3, 3))
c <- (c(NA, 0, NA, NA))
d <- (c(0, NA, 0, NA))
y <- data.frame(a, b, c, d)
head(y)
a1 <- (c(1, 1))
b1 <- (c(1, 3))
c1 <- (c(0, NA))
d1 <- (c(0, 0))
z <- data.frame(a1, b1, c1, d1)
head(z)
【问题讨论】:
-
您能否提供一些示例数据来说明您的问题(以及理想的预期输出)?
-
这两个变量总是一样的吗?如果是这样,
your_data %>% group_by(match1, match2) %>% summarize_all(coalesce)应该这样做。 -
我尝试添加一些代码。基本上,我想让 y 看起来像 z。 @SymbolixAU