doc2vec：有什么方法可以为给定向量获取最接近的匹配项？答案

【问题标题】：doc2vec: any way to fetch closest matching terms for a given vector?doc2vec：有什么方法可以为给定向量获取最接近的匹配项？
【发布时间】：2018-01-16 01:58:30
【问题描述】：

我的用例是收集“upvoted”文档和“downvoted”文档，并使用它们在搜索中重新排序一组结果。

我正在使用 gensim doc2vec 并且能够运行 most_similar 查询单词并获取匹配的单词。但是，在给定由上述 doc 向量的向量和获取的向量的情况下，我如何能够获取匹配的关键字？

【问题讨论】：

标签： word2vec gensim doc2vec

【解决方案1】：

哦，我真傻，我发现答案就在我眼前，张贴在这里以防其他人有问题：

similar_by_vector(vector, topn=10, restrict_vocab=None)

然而，这不是在 Doc2Vec 类中，而是在 KeyedVector 类中。

【讨论】：

请注意，doc2vec_model.docvecs.most_similar() 也采用原始向量，但您应该明确说明您提供的是正例列表，以避免向量数组被误解为正例-大批。具体来说，调用如下：doc2vec_model.docvecs.most_similar(positive=[new_vector]).
请注意，doc2vec_model.docvecs.most_similar() 也采用原始向量，但您应该明确说明您提供的是正例列表，以避免向量数组被误解为正例-大批。具体来说，调用如下：doc2vec_model.docvecs.most_similar(positive=[new_vector])。