【发布时间】:2017-03-26 16:13:57
【问题描述】:
我是第一次尝试 Gensim,现在有一个问题。我已经用准备好的文档语料库训练了一个 LSI 模型。我的问题是,我如何知道一个新文档是否与我从文档语料库生成的模型相似。我不想像 MatrixSimilarity 那样知道文档与我的语料库中每个文档的相似性,而是想知道文档是否与我的主题/模型相似。
【问题讨论】:
标签: python similarity gensim doc2vec
我是第一次尝试 Gensim,现在有一个问题。我已经用准备好的文档语料库训练了一个 LSI 模型。我的问题是,我如何知道一个新文档是否与我从文档语料库生成的模型相似。我不想像 MatrixSimilarity 那样知道文档与我的语料库中每个文档的相似性,而是想知道文档是否与我的主题/模型相似。
【问题讨论】:
标签: python similarity gensim doc2vec
我认为您应该对新文档进行 LSI,然后计算主题之间的相似性,请参阅此。 https://stats.stackexchange.com/questions/271359/using-lda-to-calculate-similarity/271368
【讨论】: