【问题标题】:Missing sentences from the Doc2vec representationDoc2vec 表示中的缺失句子
【发布时间】:2015-04-21 03:49:30
【问题描述】:

我正在使用 gensim 框架中的 Doc2vec 类来计算语料库中每个文档的矢量表示。

语料库包含非常短的句子,它们甚至可以有一个单词。我观察到对于许多句子,尤其是短句,Doc2vec 不提供任何表示。有人能解释一下原因吗?

【问题讨论】:

    标签: gensim word2vec


    【解决方案1】:

    我遇到了同样的问题。我通过设置参数 min_count=1 解决了。

    model = doc2vec.Doc2Vec(size=100)
    

    成为

    model = doc2vec.Doc2Vec(size=100, min_count=1)
    

    解决了我的问题!

    我在doc2vec教程http://radimrehurek.com/2014/12/doc2vec-tutorial/987654321@的cmets中找到了答案

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-07-17
      • 1970-01-01
      相关资源
      最近更新 更多