从 lda gensim 检索主题词数组和文档主题数组答案

【问题标题】：retrieve topic-word array & document-topic array from lda gensim从 lda gensim 检索主题词数组和文档主题数组
【发布时间】：2014-11-06 08:04:30
【问题描述】：

情况：

我有一个 numpy 术语文档矩阵例如：[[0,1,0,0....],....[......0,0,0,0]]。

我已将上述矩阵插入到 gensim 的 ldamodel 方法中。使用小伙子方法lda = LdaModel(corpus, num_topics=10) 效果很好。 corpus 是我上面提到的术语文档矩阵。我需要两个中间矩阵（topic-word array & document-topic array）用于研究目的。

1) 每个文档-主题概率矩阵 (p_d_t)

2) 每个主题词概率矩阵 (p_w_t)

问题：

如何从 gensim LdaModel() 函数中获取这些数组。？请帮助我获取这些矩阵。

【问题讨论】：

如果你使用 lda.print_topics(k) 它将打印每个单词的概率，并且使用 vec_lda = lda[document] 它会显示每个主题的概率。

标签： lda gensim

【解决方案1】：

1.每文档主题概率矩阵：

将transformation 应用于您的语料库。

docTopicProbMat = lda[corpus]

每个主题词的概率矩阵：

K = lda.num_topics topicWordProbMat = lda.print_topics(K)

【讨论】：