【发布时间】:2013-11-24 12:57:23
【问题描述】:
我的任务是将一个包含 32 行的数据集分成 8 个组,并且没有重复的条目。 我正在尝试通过循环并在每个循环后创建一个新数据集来做到这一点。
数据:
year pos country elo fifa cont hcountry hcont
1 2010 FRA 1851 1044 Europe RSA Africa
2 2010 MEX 1872 895 South America RSA Africa
3 2010 URU 1819 899 South America RSA Africa
4 2010 RSA 1569 392 Africa RSA Africa
5 2010 GRE 1726 964 Europe RSA Africa
6 2010 KOR 1766 632 Asia RSA Africa
8 2010 ARG 1899 1076 South America RSA Africa
9 2010 USA 1749 957 North America RSA Africa
10 2010 SVN 1648 860 Europe RSA Africa
11 2010 ALG 1531 821 Africa RSA Africa
...
到目前为止我的解决方案:
for (i in 1:8){
assign(paste("group", i, sep = ""), droplevels(subset(wc2010[sample(nrow(wc2010), 4),])))
wc2010 <- subset(wc2010, !(country %in% group[i]$country))
}
问题当然是:我不知道如何使用循环变量.... :-(
我们将不胜感激! 谢谢 鲍勃
【问题讨论】:
-
如果我们查看所有列,您的示例数据不包含任何重复项。因为是的,WC 上有 32 个不同的 国家...那么当称事物重复时,您会考虑哪些字段子集?
-
或者我现在明白了...通过避免重复,您的意思是每个国家/地区都应该归入一个并且恰好是一个组。这称为分区。
标签: r