【发布时间】:2018-07-16 04:50:28
【问题描述】:
如何按 N 列的相等累积总和拆分 data.table?这些数据包括代码,N 是每个代码的更大集合中的行数(我没有在这里复制)。
我希望能够按 aprox 拆分代码。 50,000 个 N 的 cumsum,生成行长不一的 data.tables,但唯一的代码总和约为 50,000 个 N。
实际上,N 是随机的,没有模式,但这在复制小样本量的数据方面做得很好:
dt <- dt <- data.table(code=c(1:500),N=c(rep(c(100:500),100),rep(c(100:500),100),rep(c(100:500),100), rep(c(100:500),100), rep(c(100:500),100)))
dt$cumsum <- cumsum(dt$N)
desired1 <- dt[1:233,] ###first 50,000 cumsum of N
desired2 <- dt[234:359,]
desired3 <- dt[360:565,]
desired4 <- dt[566:713,] ###etc every 50,000 cumsum of N
【问题讨论】:
标签: r split data.table cumsum