【发布时间】:2020-02-23 02:51:27
【问题描述】:
如果我们想从数据框df 中删除重复项,我们只需要编写df[!duplicated(df),] 并且将从中删除重复项。我有以下数据框:
df <- data.frame(from = c("z","y","z","w","y"), to=c("x","w","x","z","w"), weight=c(2,1,3,5,6))
我想获得一些不同的东西。在df[,1:2] 中,第一行和第三行是相等的,我想:1)删除其中一个; 2)对权重的对应值求和。例如。对于这个例子,预期的结果是:
from to weight
z x 5
y w 7
w z 5
无论如何,如果我使用:
df2=df[,1:2]
which(duplicated(df2) | duplicated(df2[nrow(df2):1, ])[nrow(df2):1])
我得到
[1] 1 2 3 5
这不允许我获得想要的结果(例如 1 和 3 相等,2 和 5 相等,但此信息不包含在后一个结果中)。
【问题讨论】:
标签: r dataframe duplicates