【发布时间】:2021-02-02 03:45:43
【问题描述】:
我的目标是计算数据框中每个变量的顶级属性的频率,但我不想只计算属性本身的频率,而是按所选属性的唯一 ID 来计算。
如果我只想计算每个变量的顶级属性的频率,我可以使用以下代码:
lapply(df, function(attribute){
j <- as.data.frame(sort(table(attribute), decreasing=TRUE)[1:10])
})
我想完全符合上述要求,但要确保每个 id 都是唯一的。我无法过滤数据框,因为它位于属性级别,并且我会丢失某些属性/变量的数据。
example input data for testing:
id v1 v2 v3 v4
1 7 1 A 100 98
2 7 2 A 98 97
3 8 1 C 50 80
4 8 1 C 78 75
5 8 1 C 50 62
6 9 3 C 75 75
【问题讨论】:
-
您想计算每个
id中每个变量的最高频率吗?那么id = 7和v1的前10 个属性,然后v2的前10 个属性等等?
标签: r