【发布时间】:2019-08-27 17:15:28
【问题描述】:
我需要找出我的数据连续几天达到阈值的位置。我正在寻找高于阈值的 4 个连续观察值。我想返回符合这些标准的系列的第一次观察的位置。
这是一个示例数据集:
eg = structure(list(t.date = structure(c(1L, 2L, 11L, 12L, 13L, 14L,
15L, 16L, 17L, 18L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L), .Label = c("4/30/11",
"5/1/11", "5/10/11", "5/11/11", "5/12/11", "5/13/11", "5/14/11",
"5/15/11", "5/16/11", "5/17/11", "5/2/11", "5/3/11", "5/4/11",
"5/5/11", "5/6/11", "5/7/11", "5/8/11", "5/9/11"), class = "factor"),
t.avg = c(4L, 4L, 5L, 6L, 10L, 18L, 18L, 18L, 18L, 12L, 10L,
10L, 8L, 8L, 9L, 10L, 6L, 5L)), .Names = c("date", "avg"
), row.names = c(NA, -18L), class = "data.frame")
我想要平均满足条件的日期(平均 >17 4 天) 一种方法:
eg$date %in% eg$date[which(eg$avg > 17)]
# [1] FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE FALSE FALSE FALSE
# [13] FALSE FALSE FALSE FALSE FALSE FALSE
在这种情况下,我可以将TRUE 的第一个案例作为答案,但如果第二个、第三个或第四个不是TRUE,这将不起作用
我需要条件为TRUE的第一个日期:
eg$date[which(eg$avg > 17)]
# [1] 5/5/11 5/6/11 5/7/11 5/8/11
以及系列中第一次观察的位置:
which(eg$avg > 17)
# [1] 6 7 8 9
我找到了相关的问题,但我无法根据自己的需要调整方法。
非常感谢。
【问题讨论】:
标签: r