【发布时间】:2019-04-17 20:28:53
【问题描述】:
我有一个子集数据,其中包含来自更大数据集的每个观察的总计数。如果我想根据更高的计数删除重复项,并且如果名称相同,则删除出现较少的代码,我将如何处理?比如:
name = c("a", "a", "b", "b", "b", "c", "d", "e", "e", "e")
code = c(1,1,2,3,4,1,1,2,2,3)
n = c(1,10,2,3,5,4,8,100,90,40)
data = data.frame(name,code,n)
最终产品会留下这些:
name = c("a", "b", "c", "d", "e")
code = c(1,4,1,1,2)
n = c(10,5,4,8,100)
data2 = data.frame(name,code,n)
【问题讨论】:
-
旁注:不要做
data.frame(cbind(...))。您已将所有数值变量转换为字符。函数data.frame()就是你所需要的:data.frame(name,code,n)。 -
@joran 谢谢。现在将改变这一点
标签: r duplicates