【发布时间】:2016-07-11 09:12:06
【问题描述】:
免责声明 - 标题可能具有误导性 - 我认为我没有找到解决方案的部分原因是我不完全知道要谷歌什么。
我有一个扩展格式的组级数据集;每个组(id)重复的年份和国家代码如下(手动输入)
year country id v1 v2 v3
1991 20 1 1 0 0
1991 20 2 0 1 0
1991 20 3 0 0 1
1991 20 4 1 0 0
1991 20 5 1 0 0
1991 20 6 0 1 0
我想在最后添加国家年份计数作为列,所以它看起来像下面
year country id v1 v2 v3 v1.count v2.count v3.count
1991 20 1 1 0 0 3 2 1
1991 20 2 0 1 0 3 2 1
1991 20 3 0 0 1 3 2 1
1991 20 4 1 0 0 3 2 1
1991 20 5 1 0 0 3 2 1
1991 20 6 0 1 0 3 2 1
我尝试了aggregate、count 和dplyr,但没有成功。我认为Group by and conditionally count 或Frequency count for a specific category 可能会成功,但我无法让它发挥作用。我怎样才能做到这一点?
【问题讨论】:
-
df$v1.count <- sum(df$v1)? -
这将总结
v1中所有年份和df中的国家/地区,不是吗?