【发布时间】:2021-12-22 17:19:46
【问题描述】:
我们可以从 AutoModel(TFAutoModel) 函数创建模型:
from transformers import AutoModel
model = AutoModel.from_pretrained('distilbert-base-uncase')
另一方面,模型是由 AutoModelForSequenceClassification(TFAutoModelForSequenceClassification) 创建的:
from transformers import AutoModelForSequenceClassification
model = AutoModelForSequenceClassification('distilbert-base-uncase')
据我所知,这两个模型都使用 distilbert-base-uncase 库来创建模型。 根据方法名称,为序列分类创建第二个类(AutoModelForSequenceClassification)。
但是 2 个类的真正区别是什么?以及如何正确使用?
(我在拥抱脸搜索但不清楚)
【问题讨论】:
-
我有一个不同之处:使用 AutoModel,我们可以使用 last_hidden_state 来获取 [CLS] 令牌。 AutoModelSequenceClassification last_hidden_state 不存在。
标签: nlp text-classification huggingface-transformers