【发布时间】:2016-03-10 05:03:55
【问题描述】:
我有一个数据框,我想通过随机选择 25 个基于 spp == cat 的 ID 值和 25 个基于 spp == dog 的 ID 值来进行子集化。
这是我的示例数据:
ID spp category prop
1 cat small_mam 0.99
2 cat small_mam 0.8
2 cat birds 0.15
3 dog large_mam 1
4 dog med_mam 0.4
4 dog emu 0.6
10 dog med_mam 0.8
10 dog birds 0.2
12 dog reptiles 1
13 dog large_mam 1
14 dog large_mam 1
15 dog large_mam 1
27 cat birds 0.2
28 cat small_mam 1
29 cat small_mam 0.75
29 cat birds 0.25
30 cat small_mam 0.7
30 cat birds 0.2
spp 的 ID 值是唯一的,这意味着 cat 和 dog 永远不会具有相同的 ID 值。 ID 范围从 1 到 696,但不一定是唯一的,这是因为 ID 最多可以由 7 个类别组成,因此为每个物种随机子设置 25 行是行不通的。
这个问题背后的背景是,我将抽取 1000 个随机样本,包含 25 只猫和 25 只狗的粪便(UID = 粪便 ID 号),用于使用 package(pgirmess) 中的 piankabio 函数进行饮食重叠的引导计算。
提前感谢您的帮助。
我使用的是 R 版本 3.1.3
【问题讨论】: