【问题标题】:Calculations based on Quartiles (Any percentile)基于四分位数的计算(任何百分位数)
【发布时间】:2021-12-26 23:08:33
【问题描述】:

例如

summary(mtcars$mpg)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  10.40   15.43   19.20   20.09   22.80   33.90 

我需要根据变量“mpg”计算每个四分位数的“disp”变量的均值和标准差。

【问题讨论】:

  • 你需要mtcars %>% group_by(mpg_grp = cut(mpg, breaks = quantile(mpg))) %>% summarise(disp_mean = mean(disp), disp_sd = sd(disp))
  • 是的,谢谢 - 我不知道剪切功能。

标签: r dplyr plyr


【解决方案1】:

cut 中使用'mpg' 的quantile 指定breaks,将其用作summarise 的分组变量@ 'disp' 的meansd

library(dplyr)
mtcars %>%
     group_by(mpg_grp = cut(mpg, breaks = c(-Inf, quantile(mpg), Inf))) %>% 
     summarise(disp_mean = mean(disp), disp_sd = sd(disp))

【讨论】:

    猜你喜欢
    • 2021-08-16
    • 2011-12-29
    • 2013-06-20
    • 2021-02-26
    • 2020-10-07
    • 2013-08-31
    • 2020-03-19
    • 2016-07-28
    • 2017-08-29
    相关资源
    最近更新 更多