【发布时间】:2019-11-25 17:42:47
【问题描述】:
我有一个大数据框,其中有一列,带有一个组名,它与 dplyr 分组。所以多行具有相同的组名。为了减少数据,我想从每组的第一个元素开始提取每个第 n 个元素。有没有没有循环的R方式?
用一个序列对每一行进行子集化,问题是每组的第一行经常被遗漏。例如
data[seq(1, nrow(data), 10), ] # Some groups start without the first row.
输入:
Val Group
1 1.0 Fruit
2 2.0 Fruit
3 3.0 Fruit
4 1.5 Veg
5 2.8 Veg
6 4.2 Veg
7 5.1 Veg
输出(每隔一个元素,注意第三行!):
Val Group
1 1.0 Fruit
2 3.0 Fruit
**3 1.5 Veg**
4 4.2 Veg
【问题讨论】:
标签: r dataframe filter dplyr grouping