【发布时间】:2019-05-13 14:42:01
【问题描述】:
我正在尝试计算冬季严重程度的指数,该指数的组成部分之一需要计算在该特定日期之前(包括该特定日期)
Day 1 = 2 degrees C
Day 2 = -2 degrees C
Day 3 = -5 degrees C
所以我尝试计算的值(称为 tempdays)在第 1 天等于 0;第 2 天 1 次;第 3 天 2 个。
这是一个显示数据外观的示例:
dat <- tibble(
date = seq(as.Date('2010-01-01'), as.Date('2010-01-10'), 1),
temp = c(4.2, 3.35, -0.6, -0.25, 0.8, 0.8, -2.5, -5.25, -0.5, 3.35)
)
dat
date temp
<date> <dbl>
1 2010-01-01 4.2
2 2010-01-02 3.35
3 2010-01-03 -0.6
4 2010-01-04 -0.25
5 2010-01-05 0.8
6 2010-01-06 0.8
7 2010-01-07 -2.5
8 2010-01-08 -5.25
9 2010-01-09 -0.5
10 2010-01-10 3.35
这是另一个以小于零的临时值开始的数据集,因为这似乎会导致问题:
dat2 <- tibble(
date = seq(as.Date('2010-01-01'), as.Date('2010-01-10'), 1),
temp = c(-1.95, -1.1, -2.8, -6.7, 1.4, 4.45, 6.1, 4.7, -1.7, -3.9)
)
dat2
所以 dat2 应该是这样的:
date temp tempdays
<date> <dbl> <dbl>
1 2010-01-01 -1.95 1
2 2010-01-02 -1.1 2
3 2010-01-03 -2.8 3
4 2010-01-04 -6.7 4
5 2010-01-05 1.4 0
6 2010-01-06 4.45 0
7 2010-01-07 6.1 0
8 2010-01-08 4.7 0
9 2010-01-09 -1.7 1
10 2010-01-10 -3.9 2
我猜lag() 可以用来做这个吗?
【问题讨论】:
-
你能不能再添加一个它应该是什么样子的样本?
-
来自链接:
i <- dat2$temp < 0; x <- cumsum(i); x - cummax((!i) * x)。