【发布时间】:2013-06-24 09:36:49
【问题描述】:
我已经查看并试用了 scikit-learn 关于其多项式朴素贝叶斯分类器的教程。
我想用它来对文本文档进行分类,而关于 NB 的问题在于它将其 P(document|label) 视为其所有独立特征(单词)的乘积。现在,我需要尝试做 3 个三元分类器,其中 P(document|label) = P(wordX|wordX-1,wordX-2,label) * P(wordX-1|wordX-2,wordX-3,标签)。
scikit learn 在哪里支持我可以实现此语言模型并扩展 NB 分类器以基于此执行分类的任何内容?
【问题讨论】:
标签: python scipy scikit-learn naivebayes