【问题标题】:LDA with topicmodels package for R, how do I get the topic probability for each term?LDA 与 R 的 topicmodels 包,我如何获得每个术语的主题概率?
【发布时间】:2016-01-26 06:32:16
【问题描述】:

我正在为 LDA 使用 topicmodels 包。我想创建一个可视化来显示每个主题的相关性或非相关性。我设想一组词是主题 1 独有的,但有一些共享的关键字连接到另一个主题。这里的任何建议都会很棒。继续:

为此,我需要知道每个主题的每个术语概率。我如何通过 topicmodels 包获得这个?我可以通过以下方式查看条款:

terms(LDAmodel, 15)

但我不知道如何获取值。想法?

【问题讨论】:

    标签: r lda topicmodels


    【解决方案1】:

    您可以使用posterior()$terms 获取每个术语的后验概率。 posterior()$topics 给出文档的概率。

    例子改编自help(LDA):

    data("AssociatedPress", package = "topicmodels")
    lda <- LDA(AssociatedPress[1:20,], k = 2)
    terms <- posterior(lda)$terms
    
    ## posterior probability for the first 5 terms (alphabetically)
    terms[,1:5]
             aaron      abandon    abandoned   abandoning       abbott
    1 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44
    2 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44 3.720076e-44
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-10-14
      • 2013-01-30
      • 2017-12-12
      相关资源
      最近更新 更多