【问题标题】:Replace values in a dataframe based on another factor which contains NA's in R根据包含 R 中的 NA 的另一个因素替换数据框中的值
【发布时间】:2010-03-31 13:07:38
【问题描述】:

我有一个数据框,其中包含(除其他外)一个带有浓度的数字列,以及一个带有状态标志的因子列。此状态标志包含 NA。

这是一个例子

df<-structure(list(conc = c(101.769, 1.734, 62.944, 92.697, 25.091, 27.377, 24.343, 55.084, 0.335, 23.280), status = structure(c(NA, NA, NA, NA, NA, NA, 2L, NA, 1L, NA), .Label = c("<LLOQ", "NR"), class = "factor")), .Names = c("conc", "status"), row.names = c(NA, -10L), class = "data.frame")

我想将浓度列替换为标志列的某些值的字符串,或者将浓度值格式化为一定数量的有效数字。

当我尝试这个时

ifelse(df$status=="NR","NR",df$conc)

状态标志中的 NA 不会触发 true 或 false 条件(并返回 NA) - 正如文档所暗示的那样。我可以遍历行并在每一行上使用 IF 然后 else 但这似乎效率低下。

我错过了什么吗?我也尝试过 as.character(df$status) ,但它不起作用。我的魔力一定越来越低了......

【问题讨论】:

    标签: r dataframe


    【解决方案1】:

    使用%in% 代替==

    ifelse(df$status %in% "NR","NR", df$conc)

    两种方法的并排比较:

    data.frame(df, ph = ifelse(df$status=="NR","NR",df$conc), mp = ifelse(df$status %in% "NR","NR",df$conc))
    

    请查看?match 了解更多信息 - 我不确定我能否很好地解释。

    【讨论】:

      【解决方案2】:

      您必须显式测试NA,以便您可以使用:

      ifelse(df$status=="NR" | is.na(df$status),"NR",df$conc) # gives you NR for NA
      

      ifelse(df$status=="NR" & !is.na(df$status),"NR",df$conc) # gives you df$conc for NA
      

      【讨论】:

        【解决方案3】:

        如何测试缺失:

        ifelse(is.na(df$status), df$conc, as.character(df$status))
        

        【讨论】:

          猜你喜欢
          • 2020-09-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2021-07-29
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多