【发布时间】:2018-08-24 06:33:34
【问题描述】:
我想绑定解码器的embedding 层和next_word 预测层的权重。嵌入维度设置为300,解码器的隐藏大小设置为600。NMT中目标语言的词汇量为50000,因此嵌入权重维度为50000 x 300,预测下一个单词的线性层的权重为50000 x 600。
那么,我怎样才能把它们绑起来呢?在这种情况下,实现重量捆绑的最佳方法是什么?
【问题讨论】:
标签: python deep-learning recurrent-neural-network pytorch seq2seq