【发布时间】:2018-02-05 19:49:11
【问题描述】:
根据我目前的理解,在为序列分类任务训练 RNN/LSTM 模型后,我可以通过以下两种方式进行预测,
- 获取最后一个状态并使用 softmax 层进行预测
- 取所有时间步的状态,在每个时间步进行预测,求和后取最大值
一般来说,有什么理由选择一个而不是另一个?或者这取决于应用程序?另外,如果我决定使用第二种策略,我应该为每个时间步使用不同的 softmax 层还是为所有时间步使用一个 softmax 层?
【问题讨论】:
标签: machine-learning neural-network deep-learning lstm recurrent-neural-network