【发布时间】:2013-04-26 20:58:59
【问题描述】:
我是 R 的新手,所以请耐心等待这个基本问题。 我有一个使用 data.table 包创建的数据集 DATA。我在 0 和 1 之间创建了 200 个随机数,然后做了 10000 次,最后为每次迭代创建了一个带有描述性统计的数据表。我的代码如下所示:
rndm<-runif(200, min=0, max=1)
reps <- data.table(x=runif(200*10000),iter=rep(1:200,each=10000))
DATA <- reps[,list(mean=mean(rndm),median=median(rndm),sd=sd(rndm),min=min(rndm),
max=max(rndm)),by=iter]
数据看起来像这样:
Mean Median SD Min Max
1 0.521 0.499 0.287 0.010 0.998
2 0.511 0.502 0.290 0.009 0.996
. ... ...
等等
我想要做的是创建一个表格,找到 N、平均值、中位数、标准差、最小值和最大值累积样本平均值(不是像上面的每一列)。我需要输出看起来像这样:
N Mean Median SD Min Max
10000 .502 .499 .280 .002 .999
我怎样才能做到这一点?
【问题讨论】:
-
哈!我想这个人在我班。
-
我仍然不明白如何获取上述格式的表格,这是我真正想要完成的。有什么建议吗?
-
我认为要让它看起来完全一样,您可能必须手动完成:
c(N=length(summary$mean),Mean=mean(summary$mean))。通过N=...,您将把标签放在上面。您要查找的所有六个内容都是标准 R 函数、?sd等。 -
reps[, as.list(c(N=.N, summary(x)))]是你要找的,我想。
标签: r data.table