【发布时间】:2019-04-11 13:33:09
【问题描述】:
我目前正在尝试以一种非常简单的方式删除 R 中的异常值。我知道您可以为此自行创建一些函数,但我想对这个简单的代码进行一些输入,以及为什么它似乎不起作用?
outliers <- boxplot(okt$pris)$out
okt_no_out <- okt[-c(outliers),]
boxplot(okt_no_out$pris)
第一行我创建了一个带有异常值的向量,第二行我创建了一个新的数据框,省略了该向量中的值。但是...当我检查新数据框时,仅删除了 750 个异常值中的大约 400 个?
向量异常值包含大约 750 行,但这样做时只会删除大约一半......
这些简单的代码行不应该以一种非常方便的方式去除异常值吗?
【问题讨论】:
-
我猜你删除了原来的异常值。但这使得胡须缩小,并且在缩减集中出现了新的异常值。需要一个最小的可重现示例来确定