【发布时间】:2021-08-01 03:52:43
【问题描述】:
我有一个由两列变量组成的数据框(混合了验证和测试数据)。我计算了两列与平均值的标准差,现在,我想修剪数据以删除误差线之外的点。
如何删除“黄色区域”之外的点,这些点不在平均值的 1 个标准差范围内?
为了举例说明我的问题,这是数据框的一小部分,包括目前使用的函数。
ppv_dataset <- data.frame(NPVF=c(537428267.18, 593361648.89, 239331813.71, 564188133.09, 309720858.48, 286511353.97, 240790667.83, 484104247.40),
npv=c(406866996.1019452, 679310854.3856647, 3816961.8569191, 685153713.2962445, 677629647.0433271, 450006801.2676973, 192824789.9761059, 492550821.6983585))
x <- apply((ppv_dataset$NPVF/100000000), 2, mean)
x.sd <- apply((ppv_dataset$NPVF/100000000), 2, sd)
y <- apply((ppv_dataset$npv/100000000), 2, mean)
y.sd <- apply((ppv_dataset$npv/100000000), 2, sd)
x_coordinates <- seq(0,8,by=1)
y_coordinates <- seq(0,8,by=1)
# Add error bars
arrows(x0=x_coordinates-x.sd, y0=y_coordinates, x1=x_coordinates+x.sd, y1=y_coordinates, code=3, angle=90, length=0.1)
arrows(x0=y_coordinates, y0=x_coordinates-x.sd, x1=y_coordinates, y1=x_coordinates+x.sd, code=3, angle=90, length=0.1)
【问题讨论】:
标签: r subset mean standard-deviation