【问题标题】:PyLDAvis visualisation does not align with generated topicsPyLDAvis 可视化与生成的主题不一致
【发布时间】:2020-04-06 21:31:34
【问题描述】:

我正在使用 PyLDAvis 可视化 Mallet 的 LDA 结果。

在此之前,我需要 gensim 库的包装器:

model = gensim.models.wrappers.ldamallet.malletmodel2ldamodel(model_list[8])

当我打印找到的主题时,它们是从 0-10 排序的。

但是,当我使用 pyLDAvis 可视化主题时,主题顺序 (0-10) 与打印的主题不一致。

例子:

(5,
  '0.042*"euro" + 0.030*"smartpho" + 0.022*"camera" + 0.020*"display" + '
  '0.018*"model" + 0.016*"picture" + 0.012*"price" + 0.010*"android"')

如您所见,本主题是关于智能手机的。

但是,当我使用 pyLDAvis 可视化模型时,主题 5 不是关于智能手机,而是关于另一个主题(例如汽车)。智能手机主题不再是 5 而是主题 1。

示例1:

示例 2:

这是一个已知错误还是正常现象? 有人可以帮忙吗?

【问题讨论】:

    标签: python gensim lda topic-modeling mallet


    【解决方案1】:

    默认情况下,pyLDAvis 按主题比例对主题进行排序 -- 要保持原始排序顺序,请将sort_topics=False 传递给pyLDAvis.prepare()。请注意,pyLDAvis 主题仍将偏移 1(即,pyLDAvis 中的主题 1 将是来自 gensim 的主题 0)。

    这里有一个类似的问题:Is there any way to match Gensim LDA output with topics in pyLDAvis graph?

    还有一个关于 pyLDAvis 存储库的相关问题:https://github.com/bmabey/pyLDAvis/issues/127

    【讨论】:

      猜你喜欢
      • 2017-06-08
      • 2018-06-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-11-04
      • 2018-12-08
      • 2017-09-01
      相关资源
      最近更新 更多