【问题标题】:doc2vec: any way to fetch closest matching terms for a given vector?doc2vec:有什么方法可以为给定向量获取最接近的匹配项?
【发布时间】:2018-01-16 01:58:30
【问题描述】:

我的用例是收集“upvoted”文档和“downvoted”文档,并使用它们在搜索中重新排序一组结果。

我正在使用 gensim doc2vec 并且能够运行 most_similar 查询单词并获取匹配的单词。但是,在给定由上述 doc 向量的向量和获取的向量的情况下,我如何能够获取匹配的关键字?

【问题讨论】:

    标签: word2vec gensim doc2vec


    【解决方案1】:

    哦,我真傻,我发现答案就在我眼前,张贴在这里以防其他人有问题:

    similar_by_vector(vector, topn=10, restrict_vocab=None)
    

    然而,这不是在 Doc2Vec 类中,而是在 KeyedVector 类中。

    【讨论】:

    • 请注意,doc2vec_model.docvecs.most_similar() 也采用原始向量,但您应该明确说明您提供的是正例列表,以避免向量数组被误解为正例-大批。具体来说,调用如下:doc2vec_model.docvecs.most_similar(positive=[new_vector]).
    • 请注意,doc2vec_model.docvecs.most_similar() 也采用原始向量,但您应该明确说明您提供的是正例列表,以避免向量数组被误解为正例-大批。具体来说,调用如下:doc2vec_model.docvecs.most_similar(positive=[new_vector])
    猜你喜欢
    • 1970-01-01
    • 2012-12-11
    • 2010-12-23
    • 2011-08-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多