【问题标题】:Demand Forecasting using multivariate time Series forecasting使用多元时间序列预测的需求预测
【发布时间】:2020-11-14 01:38:50
【问题描述】:

我有一个多元时间序列数据,其中包含 Order_date、store_id、region、product_ID、Unit_sold、discount、holiday(yes/no) 等字段。 唯一产品数为 50。 我需要对每种产品进行需求预测。 我想在这个数据集上应用 SARIMAX 模型。

我需要为每个产品单独建立单独的预测模型,还是有一些解决方法可以同时处理多个产品的预测?

另一方面:我应该如何检查多元时间序列的平稳性。我遇到了适用于单变量数据的 adf 测试和适用于多达 12 个独立变量的 Johansen 测试。 Johansen 检验是检验多元时间序列平稳性的最佳方法吗?

我是时间序列的初学者。请指导我完成这些步骤。

【问题讨论】:

    标签: python time-series arima


    【解决方案1】:

    让我们用一个例子来解决这个问题。假设您销售毛衣、宜家家具和冰淇淋。从逻辑上讲,毛衣在冬天之前和冬天卖得最好,宜家家具在周末卖得最好,但全年都相当均匀,冰淇淋在夏天卖得最好,但主要是在炎热的时候。如果您同时为所有这些拟合一个时间序列模型,即使这些产品可能都显示具有相同周期性的趋势,它们的影响将完全相反!

    当然更多的人会在周末购买冰淇淋、毛衣和家具,但周末的影响会比其他人大得多。毛衣和冰淇淋可能都显示出年度趋势,但方向相反。

    我建议您为一种产品构建模型,然后研究自动化流程,而对于其余产品,只需查看自动化流程的结果即可。


    虽然我们中的一些人有数学背景,但询问哪种(统计)测试是最好的,必然会得到主观而复杂的答案,因为这取决于具体情况。假设您正在为一家企业工作-根据我的经验,获得足够好的答案而不是完美的答案通常就足够了。 Yang and Shahabi 以 Johansen 的测试为例,如果他们失败了,就讨论如何将非平稳多元时间序列平稳化。

    最后,您会发现一种方法是否有效的主要方法是通过反复试验。如果您使用 Johansen 的检验,该序列通过了它,但您在结果中看到预测随着时间的推移变得更糟,那么时间序列显然不是平稳的。如果您想要一个数学上更正确的答案,或者您不在商业环境中工作,我会在 CrossValidated 提出第二个问题,其中有 similar 查询。

    【讨论】:

    • 感谢您的回复,鲁本。这种方法的问题是我们如何知道一个产品的预测模型将推广到所有产品。?
    • 这就是我想说的——你没有。您为一种产品制作模型,但自动执行模型制作过程,而不是模型本身
    • 好的。有什么建议的网络链接可以帮助我自动化制作这种模型的过程吗?我将尝试使用开发和测试集来检查它是否有效。
    • 只需查找feature selection time series - 那里有足够的资源
    猜你喜欢
    • 1970-01-01
    • 2014-04-03
    • 1970-01-01
    • 2020-02-08
    • 1970-01-01
    • 2020-10-05
    • 2021-09-08
    • 2019-09-06
    相关资源
    最近更新 更多