【发布时间】:2017-05-10 12:13:29
【问题描述】:
我想编写一个循环来聚合按年份分组的(某些值的)实例数。更具体地说,假设变量是x1。我想要两组,一组是x1 = 1,另一组是一些值的组合(下例中为 2,3 和 5):
year x1
2000 1
2000 1
2000 2
2000 3
2000 5
最终结果应该是这样的:
year x2 x3
2000 2 3
其中x2 和x3 分别是x1 = 1 和x1 = c(2,3,5) 时的计数。如何做到这一点?
编辑:可能应该在前面提到这一点。我使用两个数据集;一个df1 是每年一次(跨越大约200 年),另一个df2 是基于事件的(大约50k 次观测;这是x1 当前所在的位置)。所以循环的想法是查看df2 中的每一年[i],并通过在df1 中将它们分组为x2 和x3 来聚合计数。
Edit2:啊,我解决了为什么提交的答案对我不起作用。显然我在这个answer 中讨论的plyr 问题之前遇到了dplyr;我按照 ManneR 的回答和分离 plyr。现在group_by 命令又可以工作了。
【问题讨论】:
-
一个群体与另一个群体的区别是什么?
-
测量同一个现象的三个变量,都是数值型的。但是,我只想区分某些类别。如果有帮助,第一组 (x2) 始终是标量,而第二组 (x3) 始终是多个类别的聚合计数。