【发布时间】:2017-11-17 11:28:21
【问题描述】:
我有一个长格式数据集,其中每个 ID 有多个剧集,每集多行。我想为每个 ID 随机选择一集,以及所有相关的行。
例如:
df <- data.frame(id = c(1,1,1,2,2,2,2),
episode = c(1,2,2,1,1,1,2))
df
id episode
1 1 1
2 1 2
3 1 2
4 2 1
5 2 1
6 2 1
7 2 2
...我想留下这个数据集:
df2
id episode
1 1 2
2 1 2
3 2 1
4 2 1
5 2 1
【问题讨论】:
-
据我所知,您的预期输出显示每个
ID的多个剧集。这是笔误吗? -
df[df$episode != df$id, ] -
这表明对于 ID 1 我只选择了第 2 集,而对于 ID 2 我只选择了第 1 集。这就是我想要获得的。抱歉,如果问题不清楚。
标签: r dataframe random grouping