【发布时间】:2017-05-09 19:46:09
【问题描述】:
我想从数据集中绘制带有替换的集群(由变量 id 定义),与之前回答的问题相比,我希望选择 K 次的集群以使每个观察重复 K 次。也就是说,我正在做集群引导。
例如,以下样本id=1 两次,但在新数据集s 中仅重复一次id=1 的观察。我希望来自id=1 的所有观察结果出现两次。
f <- data.frame(id=c(1, 1, 2, 2, 2, 3, 3), X=rnorm(7))
set.seed(451)
new.ids <- sample(unique(f$id), replace=TRUE)
s <- f[f$id %in% new.ids, ]
【问题讨论】:
标签: r resampling statistics-bootstrap