【发布时间】:2019-04-05 10:35:21
【问题描述】:
Sklearn 的TimeSeriesSplit 是实现与 kfold 交叉验证等效的时间序列的有用方法。然而,它似乎只支持单步视野,而没有多步视野,例如它来自[1, 2, 3, 4] 的数据集,可用于分别创建以下训练集和测试集
[1, 2], [3]
[1, 2, 3], [4]
[1, 2, 3, 4], [5].
无法产生的是具有多步预测范围的东西。多步时间序列分割预测范围看起来像
[1, 2,], [3, 4]
[1, 2, 3], [4, 5]
[1, 2, 3, 4], [5, 6],
例如。
我想知道这样做是否有充分的理由?我能够实现我自己的 TimeSeriesSplit 版本,这样这不是问题,但是我是预测领域的新手。据我了解,使用这样的程序在统计上是衡量模型准确性的最佳方法。我很奇怪 sklearn 没有提供开箱即用的功能,我想知道是否有原因,以及我是否忽略了任何原因,说明为什么有如上所示的多步预测范围意味着我的方法统计准确性评估应该改变吗?
【问题讨论】:
标签: python scikit-learn time-series forecasting forecast