【发布时间】:2019-11-15 01:52:46
【问题描述】:
一个非常基本的问题,但我想知道在组标识符定义唯一值和/或缺失的数据集中,使用 dplyr 的唯一值会如何缺失?如果它是一个数字列,我会这样做:
data %>%
group_by(groupIDs) %>%
mutate(VARwithNA=max(VARwithNA, na.rm=TRUE)
但是如果它是一个字符列呢?有一个更好的方法吗?谢谢!
【问题讨论】:
-
或许
mutate(VARwithNA = toString(unique(VARwithNA[!is.na(VARwithNA)]))) -
mutate(VARwithNA = unique(na.omit(VARwithNA)))应该适用于大多数类型的数据:数字、字符、日期、时间等。 -
谢谢你!如果您想将其写为答案,我很乐意接受它