【发布时间】:2014-06-08 11:03:08
【问题描述】:
我有一个像这样的巨大数据框
head(newdata)
V1 V2 V3 V4 V5 V6 V7 V8
1 a 1941 2 14 -73.90 38.60 US009239 4
2 b 1941 2 14 -74.00 36.90 US009239 6
3 c 1941 2 14 -74.00 35.40 US009239 4
5 d 1941 2 15 -74.00 32.60 US009239 7
6 f 1941 2 15 -73.80 31.70 US009239v 1
我想做的是对具有相同 V7 特征的每个数据子集执行一些操作。我尝试将其拆分为
split(data, list(data$V7), drop = TRUE)
然后为列表中的每个元素计算V8的最小值和最大值,但是它占用了太多的内存并且真的很慢。
我该怎么做?
【问题讨论】:
标签: r split dataframe bigdata subset