【问题标题】:retrieve topic-word array & document-topic array from lda gensim从 lda gensim 检索主题词数组和文档主题数组
【发布时间】:2014-11-06 08:04:30
【问题描述】:

情况:

我有一个 numpy 术语文档矩阵 例如:[[0,1,0,0....],....[......0,0,0,0]]。

我已将上述矩阵插入到 gensim 的 ldamodel 方法中。使用小伙子方法lda = LdaModel(corpus, num_topics=10) 效果很好。 corpus 是我上面提到的术语文档矩阵。 我需要两个中间矩阵(topic-word array & document-topic array)用于研究目的。

1) 每个文档-主题概率矩阵 (p_d_t)

2) 每个主题词概率矩阵 (p_w_t)

问题:

如何从 gensim LdaModel() 函数中获取这些数组。?请帮助我获取这些矩阵。

【问题讨论】:

  • 如果你使用 lda.print_topics(k) 它将打印每个单词的概率,并且使用 vec_lda = lda[document] 它会显示每个主题的概率。

标签: lda gensim


【解决方案1】:

1.每文档主题概率矩阵:

transformation 应用于您的语料库。

docTopicProbMat = lda[corpus]
  1. 每个主题词的概率矩阵:

K = lda.num_topics topicWordProbMat = lda.print_topics(K)

【讨论】:

    猜你喜欢
    • 2022-01-14
    • 2020-12-25
    • 2017-02-19
    • 2016-07-11
    • 2018-03-16
    • 2015-06-27
    • 2020-08-03
    • 1970-01-01
    • 2015-11-15
    相关资源
    最近更新 更多