【问题标题】:test set for time series forecasting时间序列预测的测试集
【发布时间】:2020-04-14 14:05:37
【问题描述】:

以下链接中的示例具有来自时间序列数据的训练和验证集。没有提到测试集。为什么没有一个,对于一个实时生成时间序列数据的数据集来说,这意味着什么?

我以 1 秒的间隔收集了 3 小时的数据。我想在它可用之前预测下一个 30 分钟。训练/验证/测试拆分应该是什么样的?测试集可以跳过吗?

https://www.tensorflow.org/tutorials/structured_data/time_series

【问题讨论】:

    标签: tensorflow neural-network time-series lstm


    【解决方案1】:

    从不建议跳过测试集。在 TensorFlow 示例中,目的是演示如何使用时间序列;您可以像验证一样在“测试集”上进行测试,但限制条件是测试集完全未知:我们来回答您的第二个问题。

    关于测试集,在您的用例中,正如您所说,测试集是动态生成的数据。

    当然,您可以将初始数据集拆分为 train/val/test。但是,显然与您的模型“实时部署”一致的第二个测试集是预测“on-the-fly-generated-dataset”=>这意味着您可以将数据实时提供给您的模型。

    train-val-test 拆分取决于您希望如何创建模型:您想要使用多少时间步长(预测下一步时要考虑多少秒等,您尝试了多少变量预测,你想预测多少时间步长(在你的情况下,30 分钟将是 30*60 = 1800,因为你的数据集信号频率以秒为单位)。这是一个非常广泛的问题,更多地涉及如何创建用于多步预测的时间序列分析数据集。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2020-09-06
      • 2020-10-05
      • 1970-01-01
      • 2013-07-13
      • 2014-04-03
      • 2020-04-30
      • 2018-09-22
      相关资源
      最近更新 更多