【问题标题】:Substituting data using multiple conditions使用多个条件替换数据
【发布时间】:2017-12-02 06:58:27
【问题描述】:

在给定一组条件的情况下,我正在尝试替换列观察值。数据如下:

Sex     Age
male    34.5
female  NA
male    62
male    NA

我想用一个值替换性别为女性且年龄值为 NA 的数据。

我目前正在使用 for 循环:

for(i in 1:length(data$Sex){
     if(data$Sex[i]=="male"){
        if(is.na(data$Age[i])){
            data$Age[i] <- 30.7
        }
    }
 }

这工作非常好。我很好奇我是不是做对了,或者有没有一种计算上更简单的方法来做对。

提前谢谢你。 :)

【问题讨论】:

  • 如果male 为真,您的代码会修改该值,但在您的问题中,您说当Sexfemale 时要替换NA。是的,有一种更简单的方法:您可以创建一个同时检查两者的布尔条件。

标签: r data-science


【解决方案1】:

假设您要替换文本中描述的“女性”(而不是代码中的“男性”):

library(dplyr)

data %>%
  mutate(Age = if_else(Sex == "female" & is.na(Age), 30.7, Age))

输出:

# A tibble: 4 x 2
     Sex   Age
   <chr> <dbl>
1   male  34.5
2 female  30.7
3   male  62.0
4   male    NA

【讨论】:

  • 谢谢!代码工作得很好。并且替换为男性或女性,因为我想与两者一起工作。
  • 很高兴我能帮上忙
【解决方案2】:

试试这个:

 data[data$Sex=='female' & is.na(data$Age),'Age']<-30.7

【讨论】:

  • 如果你想了解这里发生了什么,请阅读 subsetting with assignment。例如adv-r.had.co.nz/Subsetting.html#subassignment
  • 谢谢陈盛林,我之前试过用代码,不知道哪里出错了。目前完美运行。该链接非常适合阅读。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2021-07-20
  • 2019-01-07
  • 1970-01-01
  • 2018-08-22
  • 2019-07-31
  • 2015-12-24
  • 2018-10-29
相关资源
最近更新 更多