【发布时间】:2014-01-23 22:38:36
【问题描述】:
我尝试使用 R 中的 ffdfdply 函数使用 'ffbase' 包对大型数据集进行聚合。
假设我有三个变量,分别称为 Date、Item 和 sales。在这里,我想使用 sum 函数汇总 Date 和 Item 的销售额。您能否指导我了解 R 中的一些正确语法。
在这里我尝试过这样的:
grp_qty <- ffdfdply(x=data[c("sales","Date","Item")], split=as.character(data$sales),FUN = function(data)
summaryBy(Date+Item~sales, data=data, FUN=sum)).
非常感谢您的解决方案。
【问题讨论】:
-
ffdfply不在基础 R 中。您应该提及您正在使用的包。 -
好的,这里我使用了 ff 包。因为我们有 ffdfdply() 用于聚合。你能帮帮我吗?
-
您应该将其编辑到问题中。当你在它的时候,也许把它清理一下?用 'u' 代替 'you' 并不是最好的风格。
-
为了在 SO 上实现“立即回复”,通常提供minimal, reproducible example 比要求“立即回复”更好。顺便说一句,
ffdfdply在ffbase包中,而不是在ff中。
标签: r grouping bigdata aggregation ffbase