【发布时间】:2016-10-30 19:58:25
【问题描述】:
我正在尝试查找列的最高累积行数,直到指定数量。所以如果我有这个数据集
df <- data.frame(x = rnorm(26, 10, 2))
我希望从顶部开始的行数总和为 100。我尝试过使用以下变体:
df %>% top_n(6)
但这不起作用。有没有我想念的可以轻松做到这一点的功能?
这种情况的用例是,如果我有一个频率列,它给出了在执行 group_by 和 desc 函数后观察出现在数据集中的百分比,然后我想要所有观察的顶部,比如 15%。
提前致谢。
【问题讨论】:
-
查看
cumsum。 -
df %>% arrange(desc(x)) %>% filter(cumsum(x) < 100).
标签: r group-by dplyr percentage