【发布时间】:2013-06-19 18:24:06
【问题描述】:
我有一个包含 1020 个尺寸测量值的数据集。我需要根据这 1020 个数字创建一个新数据集,方法是随机取出替换数字。但是,我需要通过以下方式进行随机抽样:
- 从原始数据集中随机取出两个数字。
- 选择这两个随机数中较大的一个。
- 将这个更大的数字添加到新数据集中。
- 重复步骤 1-3 多次,我有一个 1020 大小的新数据集(就像在原始数据集中一样),并且我总共有 10000 个大小为 1020 的新数据集。
我确实设法通过自举方法从原始数据集中随机挑选数字,在原始数据集的基础上创建了 10000 个新数据集:
a <- numeric(10000)
for(i in 1:10000) a[i] <- sample(size, replace = T)
但是我不知道,如何使用上面的这个命令来获得两个随机数,选择较大的一个,并将这个较大的一个放在新的数据集中。
会不会是下面的东西?
b <- numeric(10000)
for(i in 1:10000) b[i] <- sample(size, 2, ......, replace = T))
然后有一些命令(我不知道)有没有点是要从两个中获取更大的数字到新的数据集中?
【问题讨论】:
-
我将编写一个函数来执行此操作,然后使用引导包中的
boot调用它
标签: r select random statistics-bootstrap