【发布时间】:2019-03-31 03:55:04
【问题描述】:
我有一个调查数据集,并希望在 R 上进行引导,以便根据代表其在总体中的层大小的概率来选择每个层的值。我在 boot() 包上尝试了各种方法,但我不确定我是否得到了我正在寻找的结果。例如,在定义每个分层权重后使用权重参数时,我相信这只是为我的引导创建加权平均值,而不是分层重采样。我不确定我需要哪个 sim() 选项或 strata() 选项的作用。请帮忙!
sample_mean = function(value,indices){return(mean(value[indices]))}
> results=boot(value,sample_mean,1000,weights = Weight)
【问题讨论】:
-
为什么不直接使用带有 prob 参数的样本?
-
您是否尝试过在
boot()中使用strata参数? -
嗨,我需要在strata 参数中输入什么,谢谢
-
如果
value是一个数据集,那么value(tar[indices])不是有效的R 代码。它使用value,就好像它是一个函数。 -
嗨乔尔。您放入描述数据层的标签列或向量(因子或整数)。这些应该与
value的长度相同。抽奖将自动与阶层的大小成比例。
标签: r statistics sampling resampling