【问题标题】:data.table drop key rows and summarizedata.table 删除关键行并汇总
【发布时间】:2014-08-05 00:55:52
【问题描述】:

我正在寻找一种优雅的方式来遍历 data.table 的键,删除具有该键的行,然后对剩余的行进行摘要。例如:

mydt <- data.table(cat=c("a","a","b","b","c","c","c"), vals = 1:7)
setkey(mydt,cat)
tmp1 <- mydt[!"a"][,mean(vals)]
tmp2 <- mydt[!"b"][,mean(vals)]
tmp3 <- mydt[!"c"][,mean(vals)]
outdt <- data.table(cat=c("a","b","c"),means=c(tmp1,tmp2,tmp3))

有没有办法循环遍历密钥并优雅地执行此操作?谢谢。

【问题讨论】:

    标签: r data.table


    【解决方案1】:

    我认为这样做,使用更传统的data.table 代码:

    setkey(mydt,cat)
    mydt[, list(means=mean(mydt[!.BY,vals])), by=cat]
    
    # or without needing to key first
    mydt[, list(means=mean(mydt[cat != .BY,vals])), by=cat]
    
    #   cat means
    #1:   a   5.0
    #2:   b   4.2
    #3:   c   2.5
    

    【讨论】:

    • 很好的答案!注意:在 1.9.3+ 中,这看起来更具可读性:mydt[, list(means = mydt[!.BY, mean(vals)]), by=cat]
    • .BY 的绝妙使用!谢谢。
    猜你喜欢
    • 2016-07-31
    • 2021-03-14
    • 1970-01-01
    • 2013-05-07
    • 1970-01-01
    • 2017-08-11
    • 2013-04-20
    • 2019-03-19
    相关资源
    最近更新 更多