【发布时间】:2019-02-24 00:32:34
【问题描述】:
我试图在一个条件下对两个数据表进行采样,然后组合两个结果样本的列并复制这些步骤并将结果样本附加到一个新的数据表中。两张表的摘录(它们没有样本长度):
data1
month1 year
1: 1 2014
2: 2 2015
3: 3 2016
..
data2
month2
1: 4
2: 5
3: 6
..
第一个样本:
s1 = sample(data1[month = i ], 100, replace=TRUE) 其中i 从 1 变为 n
第二个样本:
s2 = sample(data2[month > i ], 100, replace=TRUE) 其中i 应该大于为 s1 选择的月份。
这两个样本应该合并到一个新的数据表中,比如dt1 = cbind(s1,s2)
我想每个月重复这些步骤,并创建一个包含所有结果样本的新数据集(伪代码):
for(i in 1:10){
s1_i = sample(data1[month = i ], 100, replace=TRUE)
s2_i = sample(data2[month > i ], 100, replace=TRUE)
new_i = cbind(s1_i,s2_i)
}
allsamples = rbind(new_1,new_2,new_3,...)
我在编写这个循环时遇到了麻烦,它不应该为每一步都创建数据集,而是只创建 allsamples 数据集,所有样本都在其中组合在一起。
【问题讨论】: