【发布时间】:2014-11-06 08:04:30
【问题描述】:
情况:
我有一个 numpy 术语文档矩阵 例如:[[0,1,0,0....],....[......0,0,0,0]]。
我已将上述矩阵插入到 gensim 的 ldamodel 方法中。使用小伙子方法lda = LdaModel(corpus, num_topics=10) 效果很好。
corpus 是我上面提到的术语文档矩阵。
我需要两个中间矩阵(topic-word array & document-topic array)用于研究目的。
1) 每个文档-主题概率矩阵 (p_d_t)
2) 每个主题词概率矩阵 (p_w_t)
问题:
如何从 gensim LdaModel() 函数中获取这些数组。?请帮助我获取这些矩阵。
【问题讨论】:
-
如果你使用 lda.print_topics(k) 它将打印每个单词的概率,并且使用 vec_lda = lda[document] 它会显示每个主题的概率。