【问题标题】:P,q,d values in arima valuesarima 值中的 P,q,d 值
【发布时间】:2021-12-12 17:13:40
【问题描述】:

我有每小时数据以及绘制 ACF 和 PCF 的时间。我能看到的数据很大程度上取决于 24 小时前的值。这意味着今天晚上 7 点高亮的值取决于最后几天晚上 7 点的值。所以我不应该是 p,q 值。这是固定数据集

fig = plt.figure(figsize=(12,8))
ax1 = fig.add_subplot(211)
fig = sm.graphics.tsa.plot_acf(data2['Count'],lags=80,ax=ax1)
ax2 = fig.add_subplot(212)
fig = sm.graphics.tsa.plot_pacf(data2['Count'],lags=80,ax=ax2)

【问题讨论】:

  • “数据高度依赖于 24 小时前的值 <...> 这是固定数据集” - ACF 显示您的数据具有季节性成分,因此它不是固定的

标签: data-science arima


【解决方案1】:

当您创建非季节性(或“正常”)ARIMA 模型时,您有一个时间序列,并在时间序列的滞后上执行自回归和移动平均模型。如果您有季节性数据,则应使用季节性 ARIMA,例如来自 statsmodels 的 SARIMAX。它基本上创建了一个仅包含前几季特定滞后的“衍生”时间序列。例如,如果您尝试预测下午 7 点的值,它会创建一个包含晚上 7 点所有观测值的时间序列。我在这里写了更具体的解释:

How does the seasonal component of Seasonal ARIMA work?

然后您在数据上创建一个 SARIMAX 模型。您有两组参数,order=(p, d, q) 用于“正常”、非季节性部分。您还有一组额外的参数seasonal_order=(P, D, Q, m)m 是一个季节的长度,所以 24。PDQ 用于在衍生的季节性时间序列上创建 ARIMA 模型。

https://www.statsmodels.org/dev/generated/statsmodels.tsa.statespace.sarimax.SARIMAX.html

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-05-09
    • 2020-10-01
    • 1970-01-01
    • 2020-12-03
    • 2021-10-21
    • 2020-05-13
    • 2020-06-02
    相关资源
    最近更新 更多