【发布时间】:2017-08-08 16:14:49
【问题描述】:
据我了解,如果我在字典大小为 1000 且没有主题 (K) = 10 的语料库上训练 LDA 模型,则对于字典中的每个单词,我应该有一个大小为10 向量中的每个位置是那个词属于那个特定主题的概率,对吧?
所以我的问题是给定一个词,这个词属于主题 k 的概率是多少,其中 k 可以是 1 到 10,我如何在 gensim lda 模型中获得这个值?
我使用的是get_term_topics 方法,但它不会输出所有主题的所有概率。例如,
lda_model1.get_term_topics("fun")
[(12, 0.047421702085626238)],
但我想看看在所有其他主题中“有趣”的可能性是什么?
【问题讨论】:
标签: gensim lda topic-modeling