【发布时间】:2014-02-28 02:58:17
【问题描述】:
我想根据时间序列创建一个预测模型。我有一个数据框,其中包括 2 列(日期和案例)。日期列从 2008-01-01 到 2013-12-01。每个月的案例都有一些数字(但是,72 个观察值中有 30 个以上的值为 NA。)因此,我想创建一个预测模型来预测 2013 年 12 月之后未来 3-4 个月的案例 - 01?谁能帮我?
这是dput(my data)的输出
structure(list(Date2 = structure(c(13879, 13910, 13939, 13970,
14000, 14031, 14061, 14092, 14123, 14153, 14184, 14214, 14245,
14276, 14304, 14335, 14365, 14396, 14426, 14457, 14488, 14518,
14549, 14579, 14610, 14641, 14669, 14700, 14730, 14761, 14791,
14822, 14853, 14883, 14914, 14944, 14975, 15006, 15034, 15065,
15095, 15126, 15156, 15187, 15218, 15248, 15279, 15309, 15340,
15371, 15400, 15431, 15461, 15492, 15522, 15553, 15584, 15614,
15645, 15675, 15706, 15737, 15765, 15796, 15826, 15857, 15887,
15918, 15949, 15979, 16010, 16040), class = "Date"), Cases = c(16352L,
NA, NA, NA, NA, NA, NA, NA, NA, NA, 10L, NA, 23L, 138L, NA, 18L,
NA, 3534L, 43L, NA, 3L, 118L, NA, 172L, 4194L, NA, 9L, 2L, 162L,
NA, 112L, 115L, NA, NA, 119L, NA, NA, 172L, NA, 25L, NA, NA,
11L, 4L, 457L, 56L, NA, 148L, 446L, 30L, NA, NA, NA, NA, NA,
NA, NA, 583L, NA, 180L, 193L, NA, 77L, NA, 18L, 15L, NA, NA,
1L, NA, NA, NA)), .Names = c("Date2", "Cases"), row.names = c(NA,
-72L), class = "data.frame")
提前感谢您的贡献。
【问题讨论】:
-
当超过一半的历史数据不可用时,做出预测有点困难。
-
我想是的。但是,如果数据集没有 NA 值,我将如何创建预测模型?因为,我将把这个预测模型应用到另一个具有相同列(案例和日期,但有一些 NA)的数据框。
-
查看包
forecast和astsa。我会看看我是否可以创建一个通用的答案。 -
非常感谢。我会尽快退房。