【发布时间】:2019-06-27 20:21:22
【问题描述】:
据我了解,每个编码器块都从前一个编码器获取输出,并且输出是序列(又名句子)的参与表示 (Z)。我的问题是,最后一个编码器块如何从 Z 产生 K,V(用于解码器的编码器-解码注意力 aublayer)
我们只是从最后一个编码器层获取 Wk 和 Wv 吗?
【问题讨论】:
-
您找到问题的答案了吗?我也很难理解解码器阶段/
标签: deep-learning nlp attention-model