【问题标题】:LSTM Sequence lengthLSTM 序列长度
【发布时间】:2018-12-08 14:46:51
【问题描述】:

大家好!

我想问一下一般中是否存在LSTM网络的最佳序列长度,或者就时间序列预测问题而言?

我读到了非常长的 RNN 网络存在的梯度消失梯度爆炸问题,LSTM 试图解决并在一定程度上取得了成功。

我还听说过使用 LSTM 和 RNN 处理非常大的序列的技术,例如:截断序列、总结序列、截断随时间的反向传播,甚至使用编码器-解码器架构。

我问这个问题是因为我没有找到关于这个的研究论文,只有这个blog post 说明了最佳10-30 之间的序列长度

提前致谢!

祝你有美好的一天!

【问题讨论】:

  • 我想说最好的方法是做一些模型选择:拆分你的训练集,用固定的 CPU 时间训练几个不同的 lstms,然后选择一个预测最好的 lstms能力。
  • 这不应该是一个使用验证集“训练”的超参数吗? (就像@Distjubo 说的)

标签: python deep-learning lstm pytorch rnn


【解决方案1】:

做一些模型选择。

TLDR:试试看吧。

由于训练的计算成本已经很高,因此计算模型成功程度的最简单方法是对其进行测试。最有效的组合不容易预先确定,尤其是对实际问题的外观进行如此模糊的描述(或根本没有描述)。

来自this answer

这完全取决于数据的性质和内部相关性,没有经验法则。但是,鉴于您拥有大量数据,2 层 LSTM 可以对大量时间序列问题/基准进行建模。

因此,在您的情况下,您可能想尝试从 10 到 30 的序列长度。但我也会尝试通过您链接的帖子评估您的训练算法在该建议之外的表现。

【讨论】:

    猜你喜欢
    • 2017-11-12
    • 1970-01-01
    • 1970-01-01
    • 2020-08-22
    • 2021-07-22
    • 1970-01-01
    • 1970-01-01
    • 2020-04-10
    • 2021-06-12
    相关资源
    最近更新 更多