【发布时间】:2021-03-17 03:46:11
【问题描述】:
这是来自article 的图片。在这里,lstm 只输出一个数字,我认为这是错误的,因为我相信 lstm 输出一个您决定的长度向量,而不仅仅是一个数字。那么,这篇文章是错的还是我遗漏了什么?
【问题讨论】:
-
这完全正确。请阅读我的回答并附上解释。
标签: machine-learning deep-learning lstm recurrent-neural-network
这是来自article 的图片。在这里,lstm 只输出一个数字,我认为这是错误的,因为我相信 lstm 输出一个您决定的长度向量,而不仅仅是一个数字。那么,这篇文章是错的还是我遗漏了什么?
【问题讨论】:
标签: machine-learning deep-learning lstm recurrent-neural-network
"lstm 只输出 一个数字 ..."
如果你指的是“[0.78572]”,那么文章没有错。
一个 LSTM 单元只输出隐藏状态。隐藏状态大小由LSTM(units=...) 中的units 参数决定。此外,单个 LSTM 单元的输出(即隐藏状态)大小等于隐藏状态大小。
因此,从文章中,底部的“[0]”是初始隐藏状态,大小为1,值为0。由于这里初始隐藏状态的大小为1,因此输出大小也应为1,即向量“[0.78572]”。
另一个例子,如果“[0]”设置为大小为 5 的“[0,0,0,0,0]”,那么现在输出应该是5个数字,例如“[0.9827, 0.1283, 0.2845, 0.8763, 0.5344]”和units 参数也应该设置为 5,例如LSTM(units=5, ...).
【讨论】: