【发布时间】:2021-07-07 00:11:11
【问题描述】:
这个问题与this one 类似,但概括起来,所以发布的答案不太合适。数据是这样的,一行标识一个单位时间对:
large_sql_df
id t var1 var2
1 1 10 0
1 2 20 1
2 1 11 0
我想按var2 和时间t 汇总:
localdf <- large_sql_df %>%
group_by(var, t) %>%
summarise(count = n(), var1_mean = mean(var1))
这给出了错误:“将表达式转换为数据类型 int 的算术溢出错误。”我认为这是因为count 成为一个非常大的数字。有没有办法阻止这种情况发生,而不必在 SQL 中执行整个查询?
【问题讨论】: