【问题标题】:How to calculate the duration in time series data with R?如何用 R 计算时间序列数据的持续时间?
【发布时间】:2018-07-22 04:14:09
【问题描述】:
mydata<-data.frame(t=lubridate::ymd(c("2018-1-1","2018-1-2","2018-1-5","2018-1-6","2018-1-7","2018-1-8")),x=c(3,1,1,3,1,3))
ggplot(mydata,aes(t,x))+geom_line()

在这种情况下,我想知道 x

【问题讨论】:

  • 为什么是“x ”。你说的持续时间是什么意思? mydata 中只有一个条目,其中 x &lt; 2。您是否在关注两个连续日期之间的差异mydata$t - dplyr::lag(mydata$t)
  • @MauritsEvers 对不起我的错误。我想计算 x
  • 但是你为什么假设mydata中的点之间有(最短的)直线呢?为什么不是阶跃函数?为什么没有其他功能?如果是直线,那么这更像是一个数学问题:计算水平线与分段线性函数的交点。
  • 我只是做一个假设。计算天数(2018-1-2)也可以,但我仍然不知道如何计算。
  • 我一点都不清楚。我不明白 "Count the days(2018-1-2) 也有效";正如我之前所说,只有一个条目是x&lt;2。所以这不会给你两天的时间。我不确定你想做什么。

标签: r time-series


【解决方案1】:

使用dplyr::lag 来做类似的事情怎么样?

# Calculate time difference to previous date
mydata$diff <- mydata$t - dplyr::lag(mydata$t);

as.numeric(sum(mydata$diff[mydata$x < 2]))
#[1] 5

或者使用完整的tidyverse 方法:

require(tidyverse);
mydata %>% 
    mutate(diff = t - lag(t)) %>%
    summarise(duration = sum(diff[x < 2]));
#    duration
#1   5 days

样本数据

mydata<-data.frame(
    t = lubridate::ymd(c("2018-1-1", "2018-1-2", "2018-1-5", "2018-1-6", "2018-1-7", "2018-1-8")),
    x = c(3, 1, 1, 3, 1, 3));

【讨论】:

  • 太棒了!谢谢!
猜你喜欢
  • 1970-01-01
  • 2015-03-30
  • 1970-01-01
  • 2019-07-04
  • 2013-11-27
  • 2013-03-07
  • 1970-01-01
  • 2018-08-27
  • 2016-01-18
相关资源
最近更新 更多