【发布时间】:2020-04-06 21:31:34
【问题描述】:
我正在使用 PyLDAvis 可视化 Mallet 的 LDA 结果。
在此之前,我需要 gensim 库的包装器:
model = gensim.models.wrappers.ldamallet.malletmodel2ldamodel(model_list[8])
当我打印找到的主题时,它们是从 0-10 排序的。
但是,当我使用 pyLDAvis 可视化主题时,主题顺序 (0-10) 与打印的主题不一致。
例子:
(5,
'0.042*"euro" + 0.030*"smartpho" + 0.022*"camera" + 0.020*"display" + '
'0.018*"model" + 0.016*"picture" + 0.012*"price" + 0.010*"android"')
如您所见,本主题是关于智能手机的。
但是,当我使用 pyLDAvis 可视化模型时,主题 5 不是关于智能手机,而是关于另一个主题(例如汽车)。智能手机主题不再是 5 而是主题 1。
示例1:
这是一个已知错误还是正常现象? 有人可以帮忙吗?
【问题讨论】:
标签: python gensim lda topic-modeling mallet