【问题标题】:Find change in two variables, grouped by 2 factors, in data.table在 data.table 中查找按 2 个因子分组的两个变量的变化
【发布时间】:2021-02-08 16:32:31
【问题描述】:

我有不定期访问的地块,以记录几个物种的生物量。我想在间隔开始时记录每个物种的生物量变化,以及间隔的持续时间

样本数据是

plot <- c(rep(1,4), rep(2,3))
species <- c(rep(c('a','b'), 2), rep('a',3))
year <- c(1,1,3,3,2,5,13)
biom <- c(5,2,8,4,3,9,18)

DT <- data.table(plot=plot, sp=sp,year=year,biom=biom)

想要的输出应该是这样的

elapsed = c(2,2,NA,NA,3,8,NA)
dbiom = c(3,2,NA,NA,6,9,NA)

(例如,样地 1 中物种 a 的生物量变化,第 1 年的第一次调查到第 2 年的第二次调查,为 +3,经过的时间为 2 年)

我一直在 data.table 中使用 'shift' 运算符,但我无法让它工作

setkey(DT, plot, sp , year)
cols = c("year","biom")
anscols = paste("lead", cols, sep="_")

b4 <- b3[ , (anscols) := shift(.SD, 1, NA, type = "lead"), 
     .SDcols=cols, by = c(plot, sp)]

我不断收到“eval 中的错误(bysub,x,parent.frame()):找不到对象 '1'”

【问题讨论】:

    标签: r data.table


    【解决方案1】:

    这样的东西可以解决问题吗?

    library(data.table)
    
    plot <- c(rep(1,4), rep(2,3))
    sp <- c(rep(c('a','b'), 2), rep('a',3))
    year <- c(1,1,3,3,2,5,13)
    biom <- c(5,2,8,4,3,9,18)
    
    DT <- data.table(plot=plot, sp=sp,year=year,biom=biom)
    
    elapsed = c(2,2,NA,NA,3,8,NA)
    dbiom = c(3,2,NA,NA,6,9,NA)
    
    DT[
      order(plot, year),
      .(year, biom,
        elapsed = year - shift(year),
        dbiom = biom - shift(biom)
      ),
      by = c("sp", "plot")
      ]
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-08-31
      • 1970-01-01
      • 2015-02-07
      • 2021-03-22
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多