【发布时间】:2017-10-27 09:35:07
【问题描述】:
我正在关注this 关于提取随机行子集的问题。
我的数据如下:
scenario urban_areas_simple place population
North Primary Urban Areas Leeds 700,000
South Primary Urban Areas London 9,000,000
Scotland Rural Shetland 22,000
... ... ...
使用 dplyr,我有以下代码,它可以工作,并根据我的 scenario 和 urban_areas_simple 列中的条件随机选择 4 行:
filter(lads,
scenario == "north" & urban_areas_simple == "Primary Urban Areas") %>%
sample_n(4)
但是,我还想随机选择行数,因为这里我只是任意选择了 4 作为示例。
对于随机大小的子集,我如何随机选择满足这些条件的行?
注意:可能只有 10-50 行满足每个条件。
【问题讨论】:
-
sample_frac(runif(1))怎么样 -
这不起作用罗宾?
-
@ThirstforKnowledge 当您尝试 Robin 的解决方案时究竟会发生什么?它对我来说很好。
-
实际上,这是我的错误,它现在正在使用 Robin 的解决方案。你想发布一个正确的答案@RobinGertenbach?
-
完成。我认为不值得添加到 Roman 的答案中,但忘记了分组的好处。