【发布时间】:2021-04-14 12:21:13
【问题描述】:
我有一个关于 fasttext 的问题 (https://fasttext.cc/)。我想下载一个预训练模型并用它从文本中检索词向量。
下载预训练模型 (https://fasttext.cc/docs/en/english-vectors.html) 后,我将其解压缩并得到一个 .vec 文件。如何将其导入 fasttext?
我尝试使用上述功能如下:
import fasttext
import io
def load_vectors(fname):
fin = io.open(fname, 'r', encoding='utf-8', newline='\n', errors='ignore')
n, d = map(int, fin.readline().split())
data = {}
for line in fin:
tokens = line.rstrip().split(' ')
data[tokens[0]] = map(float, tokens[1:])
return data
vectors = load_vectors('/Users/username/Downloads/wiki-news-300d-1M.vec')
model = fasttext.load_model(vectors)
但是,由于 python 崩溃,我无法完全运行此代码。如何成功加载这些预训练的词向量?
感谢您的帮助。
【问题讨论】:
-
请编辑您的问题以指定是否有错误消息。
-
矢量文件有多大?你的机器有多少内存?