【发布时间】:2017-03-08 13:09:51
【问题描述】:
所以,我正在对给定的数据集进行异常值检测。顺便说一句,这是在 R 中完成的。
使用 boxplot.stats(x)$out 函数,我可以获取我正在检测异常值的变量的信息。正确的?我得到了被认为是异常值的观察值。
我想要做的是在数据集中创建一个新列,该列可以是二元的,并将 1 表示为异常值,将 0 表示为非异常值。
例子:
Var1 Var2
asd 111
dsa 15
ssa 10
aas 9
dad 10
dda 95
假设观察 1 和 6 被检测为异常值:
Var1 Var2
asd 111
dda 95
当我使用时:
outlier <- boxplot.stats(Var2)$out
我只收到异常值的值 - 我在控制台中得到 111 和 95。 所以.. 在我检测到这个异常值后,我想做以下事情:
Var1 Var2 Outlier
asd 111 1
dsa 15 0
ssa 10 0
aas 9 0
dad 10 0
dda 95 1
这可能真的很容易做到,但我不知道怎么做。有什么想法吗?
【问题讨论】: