【发布时间】:2020-07-14 09:28:53
【问题描述】:
我有一个数据集,其中有多个 ID,每个 ID 有两个观察值/值,例如:
ID Test Behaviour
A12.4.2 ONE 8.64
A12.4.2 TWO 7.63
A6.3.3 ONE 1.81
A6.3.3 TWO 2.47
B12.4.1 ONE 1.17
B12.4.1 TWO 3.96
E9.4.2 ONE 13.04
E9.4.2 TWO 9.51
我发现随机抽样行以保留 ID 和与我可以使用的那些 ID 关联的观察数据的数据:
df[sample(nrow(df), 32), ]
但是,我正在努力寻找一个函数来确保每个 ID 的两个度量都包含在随机样本中。最后,我想要一个由 16 个 ID 组成的随机样本,每个 ID 有两个观察值,总共 32 个观察值。有人可以帮忙吗?
【问题讨论】:
-
感谢您的 cmets - 我已将输入数据的一部分添加到我的问题中。理想情况下,我希望输出采用相同的格式,只是作为一个子集。我希望这会有所帮助。
-
我认为您要采样的行对超过 16 行,对吧?
-
正确,我只是不允许泄露整个数据集!