【发布时间】:2018-05-27 18:48:42
【问题描述】:
每学期为每位学生购买多张停车证。试图根据他们拥有最长的许可证来删除它们。结合学生 ID 和学期以制作唯一 ID。数据框中有 80 列,但为此我只处理 2 列。
UniqueID PermitDuration
01-Fall16 10
01-Fall17 11
01-Fall17 5
01-Fall17 11
02-Fall16 5
02-Fall16 12
02-Fall17 2
02-Fall17 6
我想根据 PermitDuration 中的最大值删除 UniqueID 的重复项。所需的数据框如下所示。
UniqueID PermitDuration
01-Fall16 10
01-Fall17 11
02-Fall16 12
02-Fall17 6
【问题讨论】:
-
来自here:
unique(subset(df, PermitDuration==ave(PermitDuration, UniqueID, FUN=max))) -
仍在尝试确定共同元素,但该解决方案仅删除了少数重复项,而将大部分重复项留在了后面。
标签: r duplicates