【发布时间】:2020-11-25 23:43:13
【问题描述】:
我想确定给定变量只有缺失值的组。我的数据如下所示:
id <- seq(1:4)
year <- c(2005, 2006, 2007, 2008)
y <- c(6, 11, NA, NA, NA, NA, NA, NA, 9, NA, NA, 7, 8, 7, NA, 12)
test <- data.frame(id, year, y)
arrange(test, desc(id))
print(test)
我尝试按 id 对数据进行分组,并创建了 allNA 变量,该变量应该将只有缺失值的组分开(我还需要在最终结果中保留那些未触及的行)。然后我在具有一些非缺失值的组中进行推断:
test %>%
group_by(id) %>%
mutate(allNA = !all(is.na(y))) %>%
filter(allNA) %>%
select(-allNA) %>%
mutate(y2=na.spline(y))
我不断得到不一致的推断结果。有时,在创建 allNA 变量后,我可以看到一些 FALSE 值,它使 2007 年的值丢失或删除它们,但有时当我执行代码时它都是 TRUE 并且它推断出所有内容。我想知道 allNA 变量是否正在做它应该做的工作。因此,我决定首先确定只有 NA 的组 _ 这里 2007 年 _ 但我不知道如何做到这一点并解决外推问题。
【问题讨论】:
标签: r filtering grouping extrapolation