【发布时间】:2017-06-07 18:59:42
【问题描述】:
我想执行一个重要的group_by,通过在其中一个变量中找到的列表的单个元素对数据框进行分组和汇总。
df <- data.frame(x = 1:5)
df$y <- list("A", c("A", "B"), "C", c("B", "D", "C"), "E")
df
x y
1 1 A
2 2 A, B
3 3 C
4 4 B, D, C
5 5 E
现在按y 分组(并说计算行数),这是一个保存元素列表的变量,所需的最终结果应该是:
data.frame(group = c("A", "B", "C", "D", "E"), n = c(2,2,2,1,1))
group n
1 A 2
2 B 2
3 C 2
4 D 1
5 E 1
因为“A”出现在 2 行中,“B”出现在 2 行中等等。
注意:n 的总和不一定等于数据框中的行数。
【问题讨论】: