【发布时间】:2018-01-16 01:58:30
【问题描述】:
我的用例是收集“upvoted”文档和“downvoted”文档,并使用它们在搜索中重新排序一组结果。
我正在使用 gensim doc2vec 并且能够运行 most_similar 查询单词并获取匹配的单词。但是,在给定由上述 doc 向量的向量和获取的向量的情况下,我如何能够获取匹配的关键字?
【问题讨论】:
我的用例是收集“upvoted”文档和“downvoted”文档,并使用它们在搜索中重新排序一组结果。
我正在使用 gensim doc2vec 并且能够运行 most_similar 查询单词并获取匹配的单词。但是,在给定由上述 doc 向量的向量和获取的向量的情况下,我如何能够获取匹配的关键字?
【问题讨论】:
哦,我真傻,我发现答案就在我眼前,张贴在这里以防其他人有问题:
similar_by_vector(vector, topn=10, restrict_vocab=None)
然而,这不是在 Doc2Vec 类中,而是在 KeyedVector 类中。
【讨论】:
doc2vec_model.docvecs.most_similar() 也采用原始向量,但您应该明确说明您提供的是正例列表,以避免向量数组被误解为正例-大批。具体来说,调用如下:doc2vec_model.docvecs.most_similar(positive=[new_vector]).
doc2vec_model.docvecs.most_similar() 也采用原始向量,但您应该明确说明您提供的是正例列表,以避免向量数组被误解为正例-大批。具体来说,调用如下:doc2vec_model.docvecs.most_similar(positive=[new_vector])。