【问题标题】:Handling Missing Data in RNN / LSTM (Time-Series)处理 RNN / LSTM 中的缺失数据(时间序列)
【发布时间】:2017-09-26 14:05:33
【问题描述】:

正如标题所示,我有一个时间序列数据集,并且有很多缺失的数据。对于 LSTM 模型,处理此问题的最佳方法是什么?

为了提供更多详细信息,我有大约五个数据源来创建数据集,其中一些不允许我获取历史数据,因此我在该源中缺少很多功能。我可以使用最近观察到的样本填写一些内容,但在大多数情况下这是不可能的。

我看到的一些建议是:

  • 隐马尔可夫建模
  • 期望最大化
  • 使用神经网络预测缺失值

但总而言之,我觉得我会失去很多数据完整性。这通常是如何处理的/在 LSTM 模型中对此进行调整的最佳方法是什么?

我正在使用 Python / Keras / TensorFlow。

【问题讨论】:

    标签: python machine-learning neural-network keras lstm


    【解决方案1】:

    也许模型顶层的masking 会有所帮助。

    对于输入张量中的每个时间步(张量中的第 1 维),如果该时间步中输入张量中的所有值都等于 mask_value,则该时间步将在所有下游层中被屏蔽(跳过)(只要因为它们支持遮罩)。

    【讨论】:

      猜你喜欢
      • 2016-11-04
      • 2015-12-18
      • 1970-01-01
      • 2020-11-06
      • 1970-01-01
      • 2016-07-04
      • 1970-01-01
      • 1970-01-01
      • 2017-10-23
      相关资源
      最近更新 更多