【发布时间】:2025-12-22 21:40:10
【问题描述】:
我有多个变量的数据框,一些变量只包含 0 和 1,而其他列包含所有可能的值。
如何总结 df 列仅包含 0 和 1 与“sts_1=sum(sts_1*0.25,na.rm=T)”和其他列与“non_sts_3=mean(non_sts_3,na.rm = T)”输出指定列名。
df <- data.frame(year=c("2014","2014","2015","2015","2015"),
month_=c("Jan","Jan","Jan","Jan","Feb"),
sts_1=c(0,1,1,1,0),
sts_2=c(1,0,0,1,NA),
non_sts_1=c(0,3,7,31,10),
non_sts_2=c(1,4,NA,12,6),
non_sts_3 = c(12,14,18,1,9))
我们可以通过 dplyr 使用以下代码手动输入列名来完成
df<-group_by(df,year, month_)
df_aggregation<-summarise(df,
non_sts_1=mean(non_sts_1,na.rm = T),
non_sts_2=mean(non_sts_2,na.rm = T),
non_sts_3=mean(non_sts_3,na.rm = T),
sts_1=sum(sts_1*0.25,na.rm=T),
sts_2=sum(sts_2*0.25,na.rm=T))
提前谢谢...
【问题讨论】:
-
假设
>1足以确定差异是否安全?还是必须寻找 0,1 以外的值? -
感谢 r2evans,其他列也可能包含 0 和 1,应该是 sum 公式列仅包含 0 和 1
标签: r