【发布时间】:2022-01-11 21:10:11
【问题描述】:
当grade 列中有不同的grade 值时,我需要标记id。这是我的示例数据集的样子
df <- data.frame(id = c(11,22,33,44,55),
grade.1 = c(3,4,5,6,7),
grade.2 = c(3,4,5,NA,7),
grade.3 = c(4,4,6,5,7),
grade.4 = c(NA,NA,NA, 5, 7 ))
df$Grade <- paste0(df$grade.1, df$grade.2, df$grade.3, df$grade.4)
> df
id grade.1 grade.2 grade.3 grade.4 Grade
1 11 3 3 4 NA 334NA
2 22 4 4 4 NA 444NA
3 33 5 5 6 NA 556NA
4 44 6 NA 5 5 6NA55
5 55 7 7 7 7 7777
当 id 在 grade.1 grade.2 grade.3 和 grade.4 中具有不同的等级值时,需要标记该行。在该列中包含NA 不会影响标记。
换句话说,如果末尾的Grade 列有任何差异数字,则需要标记id。
我想要的输出应该是这样的:
> df
id grade.1 grade.2 grade.3 grade.4 flag
1 11 3 3 4 NA flagged
2 22 4 4 4 NA Not_flagged
3 33 5 5 6 NA flagged
4 44 6 NA 5 5 flagged
5 55 7 7 7 7 Not_flagged
有什么想法吗? 谢谢!
【问题讨论】: