【发布时间】:2020-03-15 18:43:36
【问题描述】:
我想知道我应该选择哪种模型来预测每月销售额。对于 1.5 年的小数据,我应该使用回归方法还是时间序列方法?
【问题讨论】:
-
检查this 帖子和他们引用的论文。
标签: machine-learning time-series regression
我想知道我应该选择哪种模型来预测每月销售额。对于 1.5 年的小数据,我应该使用回归方法还是时间序列方法?
【问题讨论】:
标签: machine-learning time-series regression
根据您拥有的数据,其中一种可能有效。或者其他技术。使用这 2 种技术中的每一种尝试 2 个简单模型,并根据通用验证数据集验证它们。这样你就会得到你的答案。除非对您用于训练的数据有相当深入的了解,否则没有人可以回答您的问题。出于我的考虑,我可能会从回归开始,但最后我认为你最终会使用其他东西。首先从简单模型开始以更好地理解问题,然后逐步微调或执行其他技巧和更复杂的模型,这始终是一个不错的选择,具体取决于您已经学习过的模型。
看看这个 Kaggle 比赛:https://www.kaggle.com/c/competitive-data-science-predict-future-sales
从那里检查几个笔记本,也许您会更多地了解在这种预测中哪些有效或无效。
笔记本链接:https://www.kaggle.com/c/competitive-data-science-predict-future-sales/notebooks
【讨论】:
我要做的第一步是明确确定您拥有多少功能。
在单变量预测(单个变量的时间观察)的情况下,您很可能会求助于统计方法,例如 ARIMA/SARIMA(我假设季节性的概念是已知的;如果不是,请阅读属性这里的时间序列:https://www.dummies.com/programming/big-data/data-science/key-properties-of-a-time-series-in-data-analysis/.
如果您有多个特征(多个变量的时间观察),您可以先尝试使用 VAR(向量自回归)。
先尝试这些模型,然后再继续使用更复杂的模型,例如 LSTM/CNNs
支持@Nicolae Petridean 的肯定,奥卡姆剃刀原则应该始终适用:从简单的模型开始,只有在尝试了几个更简单的模型之后,你才能进入深度学习技术。
另外,请记住,对于后者,与更简单的统计/数学模型甚至经典机器学习模型相比,您需要更多的数据。
【讨论】: