【发布时间】:2021-11-16 01:52:22
【问题描述】:
我正在尝试从 this page 复制代码。
在我的工作场所,我们可以访问转换器和 pytorch 库,但无法从我们的 python 环境连接到互联网。任何人都可以帮助我们在手动将文件下载到我的机器后如何让脚本工作?
我的具体问题是 -
-
我应该去bert-base-uncased at main 下载所有文件吗?我是否已将它们放在具有特定名称的文件夹中?
我应该如何更改下面的代码
# Load pre-trained model tokenizer (vocabulary)
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
# Tokenize our sentence with the BERT tokenizer.
tokenized_text = tokenizer.tokenize(marked_text)
我应该如何更改下面的代码
# Load pre-trained model (weights)
model = BertModel.from_pretrained('bert-base-uncased',
output_hidden_states = True, # Whether the model returns all hidden-states.
)
如果有人这样做,请告诉我...谢谢
###update1
我去了link 并手动将所有文件下载到一个文件夹并在我的代码中指定了该文件夹的路径。 Tokenizer 工作,但这条线 model = BertModel.from_pretrained('bert-base-uncased', output_hidden_states = True, # Whether the model returns all hidden-states. ) 失败。知道我该怎么做吗?我注意到下载的4个大文件的名字很奇怪......我应该将它们重命名为如上页所示的相同名称吗?我需要下载其他文件吗?
错误信息是OSErrr: unable to load weights from pytorch checkpoint file for bert-base-uncased2/ at bert-base-uncased/pytorch_model.bin If you tried to load a pytroch model from a TF 2 checkpoint, please set from_tf=True
【问题讨论】:
标签: python torch bert-language-model transformer doc2vec