【问题标题】:ARIMA ForecastingARIMA 预测
【发布时间】:2018-06-07 17:31:59
【问题描述】:

我有一个类似这样的时间序列数据
Loan_id Loan_amount Loan_drawn_date
id_001 2000000 2015-7-15
id_003 100 2014-7-8
id_009 78650 2012-12-23
id_990 100 2018-11-12

我正在尝试在此数据上构建一个 Arima 预测模型,该模型有大约 550 个观测值。这些是我遵循的步骤

将时间序列数据转换为每日数据,并将NA值替换为0。数据看起来像这样

Loan_id Loan_amount Loan_drawn_date

id_001 2000000 2015-7-15
id_001 0 2015-7-16
id_001 0 2015-7-17
id_001 0 2015-7-18
id_001 0 2015-7-19
id_001 0 2015-7-20
....
id_003 100 2014-7-8
id_003 0 2014-7-9
id_003 0 2014-7-10
id_003 0 2014-7-11
id_003 0 2014-7-12
id_003 0 2014-7-13
....
id_009 78650 2012-12-23
id_009 0 2012-12-24
id_009 0 2012-12-25
id_009 0 2012-12-26
id_009 0 2012-12-27
id_009 0 2012-12-28
...
id_990 100 2018-11-12
id_990 0 2018-11-13
id_990 0 2018-11-14
id_990 0 2018-11-15
id_990 0 2018-11-16
id_990 0 2018-11-17
id_990 0 2018-11-18
id_990 0 2018-11-19

谁能建议我现在如何继续使用这些 0 值?

看到贷款金额数字的差异,我会记录贷款金额的日志。我正在尝试第一次构建 ARIMA 模型,并且我已经阅读了所有插补方法,但我找不到任何东西。谁能告诉我如何继续处理这些数据

【问题讨论】:

  • "Can Someone Help Me?" is not a valid SO question。这通常表明您需要的是与当地导师一起半小时或完成教程,而不是 Stack Overflow。 SO 用于特定的编程问题;看来您需要完成有关 Armina 建模的教程。
  • @Prune--- 我是 ARIMA 建模的初学者,我只是想了解 0 值是否可以用任何数字替换。手段和模式不会担心,这就是我在这里发布这个问题的原因。
  • 建立ARIMA模型:analyticsvidhya.com/blog/2016/02/…你可以参考这个网站建立模型
  • 我认为,如果您发布尝试处理插补的代码,您将获得更好的帮助。就您的问题而言,这似乎是对场外资源或综合设计的请求,其中任何一个都与 SO 无关。

标签: python time-series missing-data arima


【解决方案1】:

我不完全了解您的特定域问题,但这些事情通常普遍适用:

    1234563有 0 个销售额)
  1. 如果 NA 值代表您的领域特定问题的未知值,则不要替换它们并适合您的 ARIMA 模型。 (如果员工在特定日期忘记写下销售额,可能是任何数字,就会出现这种情况)。

我可能根本不会使用插补。有一些方法可以在具有缺失值的时间序列上拟合 ARIMA 模型。通常这些算法也应该在 python 的某个地方实现。 (但我不知道,因为我主要使用 R)

【讨论】:

    猜你喜欢
    • 2016-02-13
    • 2020-08-26
    • 1970-01-01
    • 2023-03-30
    • 1970-01-01
    • 1970-01-01
    • 2015-06-01
    • 2015-06-29
    • 2019-05-06
    相关资源
    最近更新 更多