【发布时间】:2020-12-02 05:48:38
【问题描述】:
大家!我正在阅读有关 Bert 的文章,并想用它的词嵌入来做 文本分类。我遇到了这行代码:
pooled_output, sequence_output = self.bert_layer([input_word_ids, input_mask, segment_ids])
然后:
clf_output = sequence_output[:, 0, :]
out = Dense(1, activation='sigmoid')(clf_output)
但我无法理解合并输出的使用。 序列输出不包含所有信息,包括 ['CLS'] 的词嵌入吗? 如果是,为什么我们要合并输出?
提前致谢!
【问题讨论】:
标签: python-3.x tensorflow neural-network text-classification bert-language-model