【发布时间】:2020-11-09 14:30:58
【问题描述】:
各位大侠们好,
目前我正在尝试计算多个组的平均值。 我的 df 看起来像这样(~600 行):
col1 col2 col3 col4 col5
<type> <gender> <var1> <var2> <var3>
1 A 1 3 2 3
2 A 2 NA 5 NA
3 A 1 3 3 5
4 B 1 4 NA 1
5 B 2 3 4 5
现在结果应该是这样的:
col1 col2 col3 col4 col5
<type> <gender> <mean-var1> <mean-var2> <mean-var3>
1 A 1 3.6 4.1 4.6
2 A 2 4.1 3.8 4.2
3 B 1 3.9 4.2 3.7
4 B 2 4.3 3.2 2.7
5 C 1 3.5 4.5 3.6
6 C 2 4 3.7 4.2
...
到目前为止,我已经尝试使用group_by 函数:
avg_values<-data%>%
group_by(type, gender) %>%
summarize_all (mean())
到目前为止,还没有成功。你能帮我找出一个处理这个问题的好方法吗?
【问题讨论】:
-
尝试删除
()的意思,例如..%>% summarize_all(mean): it should suffice。 -
我刚刚注意到了!删除了我的答案