【发布时间】:2017-06-08 19:02:46
【问题描述】:
我正在使用预训练的 doc2vec BOW 模型(AP-news)。我正在执行以下操作:
import gensim.models as g
start_alpha=0.01
infer_epoch=1000
model="\\apnews_dbow\\doc2vec.bin"
m = g.Doc2Vec.load(model)
text='this is a sample text'
vec=m.infer_vector(text,alpha=start_alpha, steps=infer_epoch)
但是,如果我再次为相同的文本计算 vec,那么我将得到相同文本的不同矢量表示。为什么会发生这种情况,我该如何避免这种情况。如果我给出完全相同的文本,我希望返回相同的向量。 我尝试关注this post,但似乎没有帮助。
【问题讨论】:
-
你可以做
np.random.seed(42)这样每次初始化都是一样的? -
我应该在哪里使用这个命令?
-
在您导入 gensim.models 之后。确保你先
import numpy as np。 -
我这样做了,但它仍然为相同的文本提供不同的向量值..
标签: python random gensim doc2vec