【发布时间】:2017-04-20 13:41:41
【问题描述】:
我在文本数据上运行多标签分类时,我注意到 TFIDF 的性能大大优于 LDA。 TFIDF 准确度约为 50%,LDA 约为 29%。
这是预期的还是 LDA 应该做得比这更好?
【问题讨论】:
标签: machine-learning gensim lda text-classification
我在文本数据上运行多标签分类时,我注意到 TFIDF 的性能大大优于 LDA。 TFIDF 准确度约为 50%,LDA 约为 29%。
这是预期的还是 LDA 应该做得比这更好?
【问题讨论】:
标签: machine-learning gensim lda text-classification
LDA 通常用于无监督学习,而不是用于分类。它提供了一个生成模型,而不是判别模型 (What is the difference between a Generative and Discriminative Algorithm?),这使得它不太适合分类。 LDA 对数据预处理和模型参数也很敏感。
【讨论】: