【发布时间】:2015-01-05 21:52:01
【问题描述】:
我有一个如下所示的数据集:
Person Team
1 30
2 30
3 30
4 30
11 40
22 40
1 50
2 50
3 50
4 50
15 60
16 60
17 60
1 70
2 70
3 70
4 70
11 80
22 80
我的总体目标是组织该团队标识代码,以便轻松查看哪些团队是彼此重复的,哪些团队是独一无二的。我想总结一下数据,使其看起来像这样:
Team Duplicate1 Duplicate2
30 50 70
40 80
60
如您所见,团队 30、50 和 70 的成员相同,因此他们共享一行。同样,团队 40 和 80 具有相同的成员,因此他们共享一行。只有 60 队(在本例中)是唯一的。
在团队重复的情况下,我不在乎哪个团队 id 在哪个列中。此外,一个团队可能有 2 个以上的重复。团队规模从 2 人到 8 人不等。
【问题讨论】:
标签: r