【发布时间】:2021-06-15 08:54:30
【问题描述】:
我有一个包含多个物种的数据集,每个物种都有多个个体。列格式如下:
S Ind X Y
A 1 ax1 ay1
A 2 ax2 ay2
B 1 bx1 by1
我想为每个物种绘制一个 x-y 图,从 X 和 Y 两列中删除任何异常值。 我用过
`outliers<- boxplot(df$X plot=F)$out`
从 2 列中识别我的异常值。我还应用了一个 for 循环,它为每个物种计算这个。从我正在使用的数据集中删除它们
df2<- df[-which(df$X %in% outliers),]
当没有识别出异常值或由于样本量小而无法计算时,就会出现问题。在这种情况下, ouliers 为空,因此 df2 作为空数据帧返回。 有人可以帮助我了解我还能如何实现这一目标吗?
【问题讨论】:
-
如果异常值向量为空,则不要删除任何内容。您可以使用 if 语句来执行此操作。但是您也可以通过仅过滤与平均值接近(1.96 SE 或 2.51 SE)的元素来计算没有箱线图的异常值。这应该很容易。