【发布时间】:2017-05-08 12:27:02
【问题描述】:
我想知道是否可以更新 spacys 的默认词汇表。我正在尝试做的是:
- 使用 gensim 在我自己的语料库上运行 word2vec
- 使用
nlp.vocab.load_vectors_from_bin_loc(\path)将向量加载到我的模型中
但是由于我的语料库中的很多单词不在 spacys 默认词汇表中,所以我无法使用导入的向量。有没有(简单的)方法来添加那些缺失的类型?
编辑:
我意识到混合向量可能会有问题。所以我的问题是:
如何将自定义词汇导入 spacy?
【问题讨论】: