【问题标题】:Time series in R: How do I calculate percent change from a fixed year for multiple time series variables in R?R中的时间序列:如何计算R中多个时间序列变量从固定年份的百分比变化?
【发布时间】:2014-02-02 17:58:53
【问题描述】:

对于多个时间序列变量,如何计算相对于固定年份随时间变化的百分比?

structure(list(haiarYear = 2009:2012, 
               anyInf = c(25914L, 23601L, 22713L, 22654L), 
               haiarPatDays = c(10402161L, 10289079L, 10212208L, 10033090L), 
               rate = c(2.49121312388839, 
                        2.29379131018432, 
                        2.22410276014746, 
                        2.25792851454537)), 
               .Names = c("haiarYear", "anyInf", "haiarPatDays", "rate"), 
               row.names = c(NA, -4L), 
               class = "data.frame")
tsInfPatDays <- ts(tInfPatDays[,-1], start=2009)
options(digits=2)

生成如下所示的时间序列结构:

Time Series:
Start = 2009 
End = 2012 
Frequency = 1 
     anyInf haiarPatDays rate
2009  25914     10402161 2.49
2010  23601     10289079 2.29
2011  22713     10212208 2.22
2012  22654     10033090 2.26

我想计算每个变量相对于 2009 年的百分比变化:anyInfhaiarPatDaysrate

对于一个变量,我可以计算百分比变化:

transform(tsInfPatDays, since2009 = (rate-rate[1])/rate[1]*100)

产量:

anyInf haiarPatDays rate since2009
 25914     10402161 2.49      0.00
 23601     10289079 2.29     -7.92
 22713     10212208 2.22    -10.72
 22654     10033090 2.26     -9.36

以下计算相对于上一年的百分比变化并对每个变量进行运算:

100*(tsInfPatDays/lag(tsInfPatDays, -1)-1)

给予:

Time Series:
Start = 2010 
End = 2012 
Frequency = 1 
     tsInfPatDays.anyInf tsInfPatDays.haiarPatDays tsInfPatDays.rate
2010               -8.93                    -1.087             -7.92
2011               -3.76                    -0.747             -3.04
2012               -0.26                    -1.754              1.52

以此为模型,我希望能够通过索引 2009 年参考数据tsInfPatDays[1,] 来执行我需要的计算

  anyInf haiarPatDays         rate 
2.59e+04     1.04e+07     2.49e+00

然后:

(tsInfPatDays-tsInfPatDays[1,])/tsInfPatDays[1,]*100

第一行似乎计算正确,但随后的行显然是错误的。

我已经看到了行减法的转置矩阵方法。虽然不是百分比,但作为概念证明,我尝试从时间序列行中减去参考行的值。我收到以下错误:

t(tsInfPatDays-t(tsInfPatDays[1,]))

Error in `-.default`(tsInfPatDays, t(tsInfPatDays[1, ])) : 
  non-conformable arrays

如果我在使用转置矩阵方法之前尝试提取数据,我会得到同样的错误:

 t(tsInfPatDays-t(drop(coredata(tsInfPatDays[1,]))))

 Error in `-.default`(tsInfPatDays, t(drop(coredata(tsInfPatDays[1, ])))) : 
 non-conformable arrays

【问题讨论】:

  • 查看data.table 包,然后查看?data.table 中的rollmult 参数

标签: r matrix time-series percentage


【解决方案1】:

您可以遍历列:

 ts(sapply(tsInfPatDays,function(x)(x-x[1])/x[1]*100), start= 2009)
Time Series:
Start = 2009 
End = 2012 
Frequency = 1 
         anyInf haiarPatDays       rate
2009   0.000000     0.000000   0.000000
2010  -8.925677    -1.087101  -7.924726
2011 -12.352396    -1.826092 -10.722100
2012 -12.580073    -3.548022  -9.364298

【讨论】:

  • 虽然您的解决方案解决了我的问题,但我想我希望了解如何操作 ts 结构以及为什么它们在某些方面像矩阵一样工作,而不是其他方面。由于 diff() 和 lag() 相对于其他时间点进行操作,我认为将函数应用于具有绝对时间点参考的 ts 结构应该很容易。
  • @penguinv22 就我个人而言,我不经常使用ts,而正是这种“奇怪/不统一”的行为。我更喜欢使用xts 包。
猜你喜欢
  • 1970-01-01
  • 2015-09-29
  • 1970-01-01
  • 2020-10-19
  • 1970-01-01
  • 1970-01-01
  • 2013-07-17
  • 1970-01-01
  • 2023-04-10
相关资源
最近更新 更多