【发布时间】:2019-10-09 10:09:25
【问题描述】:
我在 R 中工作。我有一个大型数据集(包含 700 多个“名称”),其中一个子集如下所示:
Name Value
Harris 64
Harris 78
Harris 4
Jackson 102
Jackson 170
Drew 75
Smith 143
Smith 38
我想编写一个函数,根据我拥有的一组限制将值标记为每个“名称”的异常值:
Name Limit
Harris 0 - 70
Jackson 0 - 150
Drew 0 - 80
Smith 0 - 70
我想说的是,基于限制,如果有任何值超出限制,则生成一个新表,将其标记为异常值。我想这是一个新列,异常值为“TRUE”,示例如下:
Name Value Outlier
Harris 64 FALSE
Harris 78 TRUE
Harris 4 FALSE
Jackson 102 FALSE
Jackson 170 TRUE
Drew 75 FALSE
Smith 143 TRUE
Smith 38 FALSE
如果我只使用一个“名称”来执行此操作,我会使用 subset 函数,但由于我有多个名称必须与我的限制相匹配,我不确定从哪里开始。
【问题讨论】: