LSTM是什么

LSTM即Long Short Memory Network,长短时记忆网络。它其实是属于RNN的一种变种,可以说它是为了克服RNN无法很好处理远距离依赖而提出的。

我们说RNN不能处理距离较远的序列是因为训练时很有可能会出现梯度消失,即通过下面的公式训练时很可能会发生指数缩小,让RNN失去了对较远时刻的感知能力。


LSTM神经网络

解决思路

LSTM神经网络

LSTM模型

回顾一下RNN的模型,如下图,展开后多个时刻隐层互相连接,而所有循环神经网络都有一个重复的网络模块,RNN的重复网络模块很简单,如下下图,比如只有一个tanh层。 
LSTM神经网络

LSTM神经网络

而LSTM的重复网络模块的结构则复杂很多,它实现了三个门计算,即遗忘门、输入门和输出门。每个门负责是事情不一样,遗忘门负责决定保留多少上一时刻的单元状态到当前时刻的单元状态;输入门负责决定保留多少当前时刻的输入到当前时刻的单元状态;输出门负责决定当前时刻的单元状态有多少输出。

LSTM神经网络

每个LSTM包含了三个输入,即上时刻的单元状态、上时刻LSTM的输出和当前时刻输入。

LSTM的机制

LSTM神经网络


LSTM神经网络

LSTM神经网络


LSTM神经网络


LSTM神经网络


LSTM神经网络


LSTM神经网络


LSTM神经网络


LSTM神经网络

LSTM的训练


LSTM神经网络


LSTM神经网络

LSTM神经网络

LSTM神经网络

LSTM神经网络

LSTM神经网络



相关阅读: 
循环神经网络 
卷积神经网络 
机器学习之神经网络 
机器学习之感知器 
神经网络的交叉熵损失函数


========广告时间========

鄙人的新书《Tomcat内核设计剖析》已经在京东销售了,有需要的朋友可以到 https://item.jd.com/12185360.html 进行预定。感谢各位朋友。

为什么写《Tomcat内核设计剖析》

=========================

欢迎关注:

LSTM神经网络

相关文章:

  • 2022-01-07
  • 2021-09-09
  • 2021-07-20
  • 2021-07-07
  • 2021-11-25
  • 2021-10-25
  • 2021-09-12
猜你喜欢
  • 2021-05-04
  • 2021-07-22
  • 2022-01-20
  • 2021-10-28
  • 2022-12-23
相关资源
相似解决方案