【发布时间】:2020-03-26 13:35:30
【问题描述】:
我有一个包含多个列的数据框,其中 rowSums 是 1 或 0.9。
如果一列是0.5,那么另一列必须是0.5。如果一列是0.3,那么其他两个必须具有相同的值。
df <- data.frame(A = c(0, 0, 0.3, 0.5, 0, 0.3, 0.5), B = c(0, 0, 0.3, 0.5, 0, 0.3, 0.5),
C = c(1, 1, 0.3, 0, 1, 0.3, 0))
最后我需要的是另一列 (result),其列名的值 > 0。
> df
A B C result
1 0.0 0.0 1.0 C
2 0.0 0.0 1.0 C
3 0.3 0.3 0.3 A-B-C
4 0.5 0.5 0.0 A-B
5 0.0 0.0 1.0 C
6 0.3 0.3 0.3 A-B-C
7 0.5 0.5 0.0 A-B
谢谢!
【问题讨论】:
-
快一点的基本 R 选项可以是
indx <- which(df > 0, arr.ind = TRUE) ; df$result <- tapply(names(df)[indx[, "col"]], indx[, "row"], toString)