【问题标题】:R: get the column names where rowSum is equal to a valueR:获取rowSum等于一个值的列名
【发布时间】:2020-03-26 13:35:30
【问题描述】:

我有一个包含多个列的数据框,其中 rowSums10.9。 如果一列是0.5,那么另一列必须是0.5。如果一列是0.3,那么其他两个必须具有相同的值。

df <- data.frame(A = c(0, 0, 0.3, 0.5, 0, 0.3, 0.5), B = c(0, 0, 0.3, 0.5, 0, 0.3, 0.5), 
C = c(1, 1, 0.3, 0, 1, 0.3, 0))

最后我需要的是另一列 (result),其列名的值 > 0。

> df
    A   B   C result
1 0.0 0.0 1.0      C
2 0.0 0.0 1.0      C
3 0.3 0.3 0.3  A-B-C
4 0.5 0.5 0.0    A-B
5 0.0 0.0 1.0      C
6 0.3 0.3 0.3  A-B-C
7 0.5 0.5 0.0    A-B

谢谢!

【问题讨论】:

  • 快一点的基本 R 选项可以是 indx &lt;- which(df &gt; 0, arr.ind = TRUE) ; df$result &lt;- tapply(names(df)[indx[, "col"]], indx[, "row"], toString)

标签: r dataframe rowsum


【解决方案1】:

你可以这样做:

df$result <- apply(df, 1, function(x) paste(names(df)[x > 0], collapse = "-"))

df
    A   B   C result
1 0.0 0.0 1.0      C
2 0.0 0.0 1.0      C
3 0.3 0.3 0.3  A-B-C
4 0.5 0.5 0.0    A-B
5 0.0 0.0 1.0      C
6 0.3 0.3 0.3  A-B-C
7 0.5 0.5 0.0    A-B

【讨论】:

    【解决方案2】:

    library(tidyverse)

    df %>% 
    mutate(id = row_number()) %>% 
    pivot_longer(-id, names_to = "cd", values_to = "vals") %>% 
    filter(vals > 0) %>% 
    group_by(id) %>% 
    summarise(new_val = paste(cd, collapse = "-")) %>% 
    ungroup() %>% 
    cbind(df, .)
    

    【讨论】:

      猜你喜欢
      • 2020-01-15
      • 2021-06-10
      • 2021-06-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多