【发布时间】:2019-10-06 09:30:27
【问题描述】:
我是自然语言处理的新手,我发现 this 有趣的教程描述了如何进行主题建模。
本教程可data
源码:here
上面的代码可以使用LDA提供主题建模并生成k个主题。我的问题是如何找到哪个文档属于哪个主题(集群)?如图here所示的例子。我想知道类似:
publish_date:20030219 with text (aba ...) 属于主题 1 集群 或..
我已经阅读了以下帖子: [1] 或 [2] 但我仍然无法得到答案。
我也尝试过 Matlab 文本分析工具箱,但我还想不通。
如果您能提供任何帮助,那就太好了。
【问题讨论】:
标签: python gensim lda topic-modeling natural-language-processing