【发布时间】:2015-01-02 09:34:45
【问题描述】:
我想知道是否有一种方法可以使用 R 中的 dplyr 包计算排除异常值的平均值?我试图做这样的事情,但没有奏效:
library(dplyr)
w = rep("months", 4)
value = c(1, 10, 12, 9)
df = data.frame(w, value)
output = df %>% group_by(w) %>% summarise(m = mean(value, na.rm = T, outlier = T))
所以在上面的例子中,输出应该是 10.333(10、12 和 9 的平均值)而不是 8(1、10、12、9 的平均值)
谢谢!
【问题讨论】:
-
为什么我们认为 1 是异常值?
-
@BondedDust Ah..我应该定义它。就我而言,离群值是与平均值有最大差异的值。
标签: r statistics