【发布时间】:2018-07-29 05:07:00
【问题描述】:
我想从我的数据框中删除至少一个变量超过 2 个标准差的所有观察结果。我有 38 个变量和另外两列。
这些行提取异常值:
std=2
outliers = boxplot(data[3:40], plot=FALSE,range=std)$out
但我无法更新我的数据框,我尝试了很多方法,例如:
data[3:40][!data[3:40] %in% outliers]
你能帮帮我吗?
【问题讨论】:
-
我通常使用 ggplot,但是看着
?boxplot:也许可以试试outline = FALSE -
data是什么?请提供Reproducible Example -
data 是一个有 40 列的数据集,但我找到了解决问题的方法
-
您应该将您的解决方案添加为答案并将其标记为正确,而不是编辑您的问题以将其添加到