【发布时间】:2018-02-28 03:24:12
【问题描述】:
我正在研究 NLP 序列标记问题。我的数据由可变长度序列(w_1, w_2, ..., w_k) 和相应的标签(l_1, l_2, ..., l_k) 组成(在这种情况下,任务被命名为实体提取)。
我打算使用循环神经网络来解决这个问题。由于序列的长度可变,我需要填充它们(我希望批量大小>1)。我可以选择对它们进行预零填充,或者对它们进行零填充。 IE。要么我使每个序列(0, 0, ..., w_1, w_2, ..., w_k) 或(w_1, w_2, ..., w_k, 0, 0, ..., 0) 使每个序列的长度相同。
前填充和后填充之间的选择对结果有何影响?
似乎预填充更常见,但我找不到解释为什么它会更好。由于 RNN 的性质,我觉得这是一个随意的选择,因为它们在时间步长之间共享权重。
【问题讨论】:
-
对此也感兴趣?有什么好心人有一些不错的答案吗...?
标签: performance machine-learning recurrent-neural-network