【发布时间】:2020-08-13 23:13:07
【问题描述】:
我有一个产品数据集,其中两列代表分类。我想根据这两组的并集获得一个组 id。
组 id 必须是可传递的,如果观察 1 和 2 的 class1 相同,并且 2 和 3 的 class2 相等,则 1,2 和 3 相等。在示例中,您可以看到传递性在第 1-4 列具有相同 group_id 的结果中起作用。
任何关于如何做到这一点的提示将不胜感激 =)
# Example
df <- tribble(
~id, ~class1, ~class2,
1, "A", "L1",
2, "A", "L1",
3, "B", "L1",
4, "B", "L2",
5, "C", "L3",
6, "D", "L4")
# Desired output
result <- tribble(
~id, ~class1, ~class2, ~group_id,
1, "A", "L1", 1,
2, "A", "L1", 1,
3, "B", "L1", 1,
4, "B", "L2", 1,
5, "C", "L3", 2,
6, "D", "L4", 3)
【问题讨论】: