【发布时间】:2013-09-28 10:55:58
【问题描述】:
我猜这确实是两个问题。我正在尝试使用 data.table 包来总结一个大型数据集。假设我的原始大型数据集是 df1,不幸的是 df1 有 50 列(y0...y49),我想要 3 个字段(segmentfield1、segmentfield2、segmentfield3)的总和。有没有比输入每个 y0...y49 列更简单的方法?与此相关的是,data.table 是否有一个通用的 na.rm=T 而不是每个总和都输入它?
dt1 <- data.table(df1)
setkey(dt1, segmentfield1, segmentfield2, segmentfield3)
dt2 <- dt1[,list( y0=sum(y0,na.rm=T), y1=sum(y1,na.rm=T), y2=sum(y2,na.rm=T), ...
y49=sum(y49,na.rm=T) ),
by=list(segmentfield1, segmentfield2, segmentfield3)]
【问题讨论】:
-
@rcs,不是完全重复,而是类似
标签: r data.table