【发布时间】:2016-02-20 17:04:19
【问题描述】:
我有一个很大的 data.frame,我想创建一个新的 data.frame,其中包含基于两列随机选择的行。
每个 FixDate 有 90 个唯一的 elkID,大约 48 行。我想创建一个新的 data.frame,其中包含 90 个唯一的 elkID,每个 FixDate 有 4 个随机选择的行。
数据如下所示:
> head(df)
elkID X Y Fix.Date.Time FixDate
1 245 550345.1 4826676 2010-02-24 10:00:58 2010-02-24
2 245 550217.9 4826519 2010-02-24 10:30:47 2010-02-24
3 245 550066.3 4826478 2010-02-24 11:00:41 2010-02-24
4 245 549912.6 4826419 2010-02-24 11:30:48 2010-02-24
5 245 549977.3 4826438 2010-02-24 12:00:55 2010-02-24
6 245 549795.1 4826294 2010-02-24 12:30:29 2010-02-24
我希望它看起来像这样(每个唯一 elkID 的每个 FixDate 4 行):
> df2
elkID X Y Fix.Date.Time FixDate
1 245 550345.1 4826676 2010-02-24 10:00:58 2010-02-24
2 245 550217.9 4826519 2010-02-24 10:30:47 2010-02-24
3 245 550066.3 4826478 2010-02-24 11:00:41 2010-02-24
4 245 549912.6 4826419 2010-02-24 11:30:48 2010-02-24
5 245 549977.3 4826438 2010-02-24 12:00:55 2010-02-25
6 245 549795.1 4826294 2010-02-24 12:30:29 2010-02-25
使用 RStudio V0.99.467 和 R3.2.1
【问题讨论】:
-
我曾经有过类似的需求。我写了一个小函数来执行这种基于列和值的分层。也许它可以帮助你,请参阅
SciencesPo包中的stratified。
标签: r loops random unique subset