Scikits NB 与 NLTK NB 的性能对比答案

【问题标题】：Performance of Scikits NB vs NLTK NBScikits NB 与 NLTK NB 的性能对比
【发布时间】：2013-01-15 01:19:30
【问题描述】：

我通过绘制它们对应的学习曲线，比较了 NLTK 和 Scikits（伯努利版本，类先验并不重要，因为我为每个类使用完全相同数量的训练示例）中朴素贝叶斯的两种实现的性能对于我的三级问题。 X 轴是训练数据集大小（忘记实际值），Y 是准确度。 Here is 我得到了什么。

造成这种性能差异的原因是什么？

【问题讨论】：

【解决方案1】：

NLTK 没有实现伯努利朴素贝叶斯。相反，它的NaiveBayesClassifier 使用多项式 NB 决策规则和布尔特征。

虽然实际上有时会推荐这种多项式和伯努利 NB 部分的组合（例如，Jurafsky and Manning 用于情绪分析），但它通常代表两全其美，而且很可能是错误的结果。

【讨论】：