【发布时间】:2018-11-13 01:28:15
【问题描述】:
我有一个 statcast 数据列表,可以追溯到 2016 年。我正在尝试汇总这些数据以找到每个投球 ID 的平均值。
我有以下代码:
aggpitch <- aggregate(pitchingstat, by=list(pitchingstat$PitcherID),
FUN=mean, na.rm = TRUE)
此函数聚合每一列。我希望只聚合一定数量的列。
如何只包含某些列?
【问题讨论】:
-
您想指定一个要聚合的变量 -
aggregate(pitchingstat[c("var1","var2")], pitchingstat["PitcherID"], FUN=mean, na.rm=TRUE)。或者,使用公式接口aggregate(cbind(var1,var2) ~ PitcherID, data=pitchingstat, FUN=mean, na.rm=TRUE)。看到这个旧答案 - stackoverflow.com/a/9723314/496803