【发布时间】:2019-06-17 23:26:44
【问题描述】:
根据Gensim's page on WordEmbeddingKeyedVectors,可以增量添加新词向量的新键值对。但是,在使用预训练的向量及其标签初始化 WordEmbeddingKeyedVectors,并向其添加新的看不见的模型推断词向量后,most_similar 方法将无法再使用。
from gensim.models.keyedvectors import WordEmbeddingsKeyedVectors
test = WordEmbeddingsKeyedVectors(vector_size=3)
test.add(entities=["1", "2"], weights=[np.random.randint(5, size=3),
np.random.randint(5, size=3)])
test.most_similar("2") #THIS WORKS
test.add(entities=['3'], weights=[np.random.randint(5, size=3)])
test.most_similar("3") #THIS FAILS
我希望输出是与输入标签最相似的向量标签列表,但输出是:
IndexError:索引 2 超出轴 0 的范围,大小为 2
【问题讨论】:
-
格式化代码会对读者有所帮助
-
感谢您的反馈!刚刚编辑。
标签: python gensim word2vec doc2vec