【发布时间】:2014-04-23 10:05:10
【问题描述】:
我正在寻求调整两个现有脚本的帮助。
我正在使用纵向数据集,并在一段时间内聚合一个关键变量。我对weeks 和months 都有一个变量。我能够汇总weeks 和months - 但我的目标是在前六周 的几周内进行汇总,然后在 6 周后按月进行汇总周+。
按周和月汇总很容易......
df.summary_week
这会产生类似的东西:
weeks var.mean
1 3.99
2 5.44
3 6.7
4 8.100
5 2.765
6 2.765
7 3.765
8 4.765
9 1.765
10 4.765
11 1.765
然后按月汇总会产生类似的结果:
df.summary_months
months var.mean
1 5.00
2 3.001
3 4.7
4 7.100
我最初的想法是简单地用切割点对两个数据集进行子集化,然后将它们绑定在一起,但是当 1 个月的聚合从 6 周而不是 8 周开始时,我不知道该怎么做。
想法,R 巫师?
【问题讨论】:
-
您可以使用
df[df$weeks>6,]按月ddply,然后使用df[df$weeks<=6]按周将其绑定到ddply-ing 的结果吗? -
@thelatemail 我可能是错的,但第一个月难道不是该月第 3 周和第 4 周的双周汇总吗?我汇总的原因是由于每个存储桶中的 n ,所以双周平均值是行不通的:(
-
是的。由于一个月有点不确定,您是否愿意从第 7 周开始将每 4 周汇总为一个“月”?
-
@thelatemail,所以“周”和“月”实际上是根据设定的起点和观测日期之间的天数差异计算得出的,然后四舍五入(按 . 5)。我认为在第 7 周后按 4 周汇总是可以的,因为正如您指出的那样,这是一门不精确的科学……但理想情况下,我可以设置不同的切点。
标签: r