【发布时间】:2020-10-16 11:18:13
【问题描述】:
我想在 data.frame 中生成一个列来计算组的连续 id(虚拟 df 中的 s 列)
dummy_df = data.frame(s = c("a", "a", "b","b", "b", "c","c", "a", "a", "c", "c","a","a"),
desired_output= c(1,1,1,1,1,1,1,2,2,2,2,3,3))
dummy_df$rleid_output = rleid(dummy_df$s)
dummy_df
s desired_output rleid_output
1 a 1 1
2 a 1 1
3 b 1 2
4 b 1 2
5 b 1 2
6 c 1 3
7 c 1 3
8 a 2 4
9 a 2 4
10 c 2 5
11 c 2 5
12 a 3 6
13 a 3 6
我会说它类似于 rleid() 所做的,但会在看到新组时重新开始计数。但是,我找不到以如此直接的方式做到这一点的方法。谢谢。
【问题讨论】:
标签: r dataframe grouping unique cumulative-sum