【发布时间】:2018-12-08 14:46:51
【问题描述】:
大家好!
我想问一下一般中是否存在LSTM网络的最佳序列长度,或者就时间序列预测问题而言?
我读到了非常长的 RNN 网络存在的梯度消失或梯度爆炸问题,LSTM 试图解决并在一定程度上取得了成功。
我还听说过使用 LSTM 和 RNN 处理非常大的序列的技术,例如:截断序列、总结序列、截断随时间的反向传播,甚至使用编码器-解码器架构。
我问这个问题是因为我没有找到关于这个的研究论文,只有这个blog post 说明了最佳10-30 之间的序列长度。
提前致谢!
祝你有美好的一天!
【问题讨论】:
-
我想说最好的方法是做一些模型选择:拆分你的训练集,用固定的 CPU 时间训练几个不同的 lstms,然后选择一个预测最好的 lstms能力。
-
这不应该是一个使用验证集“训练”的超参数吗? (就像@Distjubo 说的)
标签: python deep-learning lstm pytorch rnn