【发布时间】:2019-12-05 22:11:39
【问题描述】:
我正在尝试根据连续模式进行分组。这是数据集。
num col1
1 SENSOR_01
2 SENSOR_05
3 SENSOR_05, SENSOR_07
4 SENSOR_05, SENSOR_07
5 SENSOR_07
6 SENSOR_05
7 SENSOR_01, SENSOR_03
8 SENSOR_01
9 SENSOR_03
10 SENSOR_01
11 SENSOR_05
结构(列表(编号 = 1:11,col1 = 结构(c(1L,4L,5L,5L,6L,4L, 2L, 1L, 3L, 1L, 4L), .Label = c("SENSOR_01", "SENSOR_01, SENSOR_03", “SENSOR_03”、“SENSOR_05”、“SENSOR_05、SENSOR_07”、“SENSOR_07”),类 =“因子”)),class=“data.frame”,row.names = c(NA, -11L))
如果该行重复包含 SENSOR_05 和 SENSOR_07,则应将其分组。 SENSOR_01 和 SENSOR_03 设置类似。这是我预期的表格(组字段)。
num col1 group
1 SENSOR_01 1
2 SENSOR_05 2
3 SENSOR_05, SENSOR_07 2
4 SENSOR_05, SENSOR_07 2
5 SENSOR_07 2
6 SENSOR_05 2
7 SENSOR_01, SENSOR_03 3
8 SENSOR_01 3
9 SENSOR_03 3
10 SENSOR_01 3
11 SENSOR_05 4
这是我的代码,但效果不好。
g1 <- c("SENSOR_05", "SENSOR_07")
g2 <- c("SENSOR_01", "SENSOR_03")
test %>%
group_by(group = cumsum(col1 %in% (rep(c(g1, g2)))))
【问题讨论】: