【发布时间】:2017-11-28 13:25:49
【问题描述】:
我目前正在使用来自 text2vec 包的 LDA 执行主题建模。我设法创建了一个 dtm 矩阵,然后将LDA 及其fit_transform 方法与n_topics=50 一起应用。
在查看每个主题的热门词时,一个问题突然出现在我的脑海中。我打算之后将模型应用于新数据,并且有可能出现新词,这是模型之前没有遇到的。该模型是否仍然能够将每个单词分配给其各自的主题?此外,这些词是否也会添加到主题中,以便我可以使用get_top_words定位它们?
感谢您的回答!
【问题讨论】:
标签: text2vec