【问题标题】:When to use RNN or LSTM何时使用 RNN 或 LSTM
【发布时间】:2019-04-27 12:24:40
【问题描述】:

RNN 和 LSTM 有什么区别?我们什么时候使用这些模型?

【问题讨论】:

  • 有人请帮忙
  • 你能更好地解释你的问题吗?你在说什么情况? Seq2Seq 适用于具有编码器和解码器架构的情况。 RNN、LSTM 具有这种架构,因此它们属于那种类型。问题是什么?
  • 是的,我的意思是编码器和解码器架构。它可以是 RNN 还是 LSTM,是实现者的选择
  • 你得到答案了吗?

标签: lstm seq2seq natural-language-processing


【解决方案1】:

不完全是。 RNN,循环神经网络适用于某些任务,但由于使用 RNN 会出现一些问题,例如梯度爆炸或梯度消失问题,因此使用 LSTM 成为标准,这是一种解决这些问题的 RNN。

当您通过一个长网络进行反向传播时,会发生梯度爆炸/消失,并且由于您不断地乘以梯度,它可能会增长太多并溢出,或者它可能变得非常非常小以至于没有没有效果了。

LSTM 通过使用称为门控循环单元的机制解决了这个问题。因为它解决了标准RNN通常遇到的问题,所以LSTM更受欢迎。

了解这些主题对您来说实际上很重要,所以我会看看这个博客,它通过图表和示例完美地解释了它们。 https://skymind.ai/wiki/lstm

【讨论】:

    猜你喜欢
    • 2017-10-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-09-15
    • 2021-08-16
    • 2018-06-15
    • 2016-11-21
    相关资源
    最近更新 更多