【发布时间】:2019-09-26 19:18:15
【问题描述】:
我有两个关于如何使用变形金刚的 Tensorflow 实现进行文本分类的问题。
- 首先,似乎人们大多只使用编码器层来完成文本分类任务。然而,编码器层为每个输入单词生成一个预测。根据我对转换器的理解,每次输入到编码器的都是输入句子中的一个单词。然后,使用当前输入词计算注意力权重和输出。我们可以对输入句子中的所有单词重复这个过程。结果,我们最终会得到输入句子中每个单词的成对(注意力权重,输出)。那是对的吗?那么你将如何使用这些对来执行文本分类呢?
- 第二,基于transformerhere的Tensorflow实现,他们将整个输入句子嵌入到一个向量中,并将这些向量中的一批输入到Transformer中。但是,根据我从The Illustrated Transformer 学到的知识,我希望输入是一批单词而不是句子
谢谢!
【问题讨论】:
标签: tensorflow nlp transformer bert-language-model