替换列条件 dplyr答案

【问题标题】：Replace column condition dplyr替换列条件 dplyr
【发布时间】：2020-04-03 23:46:51
【问题描述】：

ID <- c("A","B","C","D","E")
AT <- c(0.1,0.2,0.3,0.4,0.5)
US <- c(NA,NA,0.6,NA,NA)
FIGX <- c(1,NA,NA,2,3)
W1 <- c(NA,10,20,30,40)
test.Data <- data.frame(ID,AT,US,FIGX,W1) %>% as.data.table()

我有这种桌子。如果 NA，我想将 US 列的值替换为 FIGX 的值，如果 FIGX 为 NA，则替换为 W1 列的值。

我试过这个 test.Data %>% mutate_if(is.na(US),mutate_if(is.na(FIGX),W1)) 没有成功。我该怎么办？

【问题讨论】：

mutate(US = coalesce(US, FIGX, W1))
这能回答你的问题吗？ How to implement coalesce efficiently in R
@camille 我会说这不是一个好的骗局 - 那是关于如何编写一个执行 coalesce 的函数（并且早于 dplyr 实现多年）。这个问题是关于在 dplyr 中使用类似coalesce 的函数，问题的根源似乎是mutate_if 和ifelse 之间的混淆。
@IRT，如果您在 mutate、test.Data %>% mutate(ifelse(is.na(US), ifelse(is.na(FIGX), W1, FIGX), US)) 中使用 ifelse，您的尝试会奏效，但 coalesce 是为像这样替换 NAs 而设计的，并且更简洁。如果您想对满足条件的多个列执行完全相同的操作，请使用 mutate_if - 例如，舍入所有数字列，或记录所有严格为正的数字列，或为所有日期列添加一周。
@Gregor 这很公平，尽管 dplyr 函数包含在至少一个答案中。我不认为mutate_if 问题是关键，因为无论如何它都不是正确使用该功能

标签： r dplyr

【解决方案1】：

这是一个带有daa.table 的选项，因为输入数据已经是data.table

library(data.table)
library(dplyr)
test.Data[is.na(US), US := coalesce(FIGX, W1)][]
test.Data
#   ID  AT   US FIGX W1
#1:  A 0.1  1.0    1 NA
#2:  B 0.2 10.0   NA 10
#3:  C 0.3  0.6   NA 20
#4:  D 0.4  2.0    2 30
#5:  E 0.5  3.0    3 40

对于多列，我们可以使用set

colsOfInterest <- c("US", "AT")
for(nm in colsOfInterest){
   i1 <- which(is.na(test.Data[[nm]]))
   set(test.Data, i = i1 ,
         j = nm, value = coalesce(test.Data[["FIGX"]][i1], test.Data[["W1"]][i1]))
  }

【讨论】：

coalesce(US, FIGX, W1)，不需要case_when。
如果我不仅需要为美国而且为所有可能的列（实际上我有 30 列）这样做，如何概括。我一直在寻找循环方式。
嗨，当我执行这些行时，出现错误：Error i set(tmp,i=i1,j=nm,value = coalesce(tmp[["FIGX"]][i1] ,tmp[["W1"]][i1]): 未使用的参数 (tmp[["W1"]][i1])。知道为什么吗？
抱歉，无法复制