【发布时间】:2019-02-28 07:16:52
【问题描述】:
我在 R 中创建了以下数据框
df<-data.frame("ID"=c("A", "A", "A", "B", "B", "B"),"II"=c(NA, NA,
NA,1,2,3),"JJ"=c(1,2,3, NA, NA, NA), 'KK'=c(1,2,NA, NA, 5,6))
生成的dataframe如下
ID II JJ KK
A NA 1 1
A NA 2 2
A NA 3 NA
B 1 NA NA
B 2 NA 5
B 3 NA 6
我想通过 ID 值对数据框进行子集化,并将所有仅包含 NA 值的列替换为 999。结果应如下所示
ID II JJ KK
A 999 1 1
A 999 2 2
A 999 3 NA
B 1 999 NA
B 2 999 5
B 3 999 6
我试过这个代码
library(dplyr)
df%>%
group_by(ID)%>%
select(II, JJ,KK)%>%
mutate_if(df[, colSums(is.na(df)) == nrow(df)]<999)
我收到以下错误
Adding missing grouping variables: `ID`
Error in tbl_if_vars(.tbl, .p, .env, ..., .include_group_vars =
.include_group_vars) :
length(.p) == length(tibble_vars) is not TRUE
我请人看一看。我无法弄清楚。对于基于 dplyr 的解决方案不是必需的
【问题讨论】:
-
不是@tifu推荐的副本
-
你是对的,将删除推荐