使用朴素贝叶斯训练模型答案

【问题标题】：Training a model when using Naive Bayes使用朴素贝叶斯训练模型
【发布时间】：2020-06-28 15:46:19
【问题描述】：

我有一个电影评论数据集，我想对其进行情感分析。

我已经使用逻辑回归实现了这一点。以下是我在此过程中采取的步骤：

现在，我需要使用朴素贝叶斯来实现同样的事情，我对如何解决这个问题感到困惑。我假设前 4 个步骤将是相同的。但是使用朴素贝叶斯的训练步骤是什么？在这种情况下，损失函数和成本函数是什么？我在哪里使用贝叶斯定理来计算条件概率？以及如何更新权重和偏差？

我在网上搜索了很多资源，但我大多只找到了使用带有 model.fit 和 model.predict 的 sklearn 的实现，我很难弄清楚这背后的数学原理以及它是如何实现的使用 vanilla python 实现。

【问题讨论】：

对于Cross Validated 或Data Science 可能是一个更好的问题，因为它与基础数学和理论有关，而您没有minimal reproducible example 可以分享。话虽如此，尽管您想从头开始编写代码，但 sklearn docs 是一个很好的基础数学起点，包括方程式、分类算法的描述和论文链接
另外，你也可以去page for each NP classifier type，在标题附近的右上角，你可以点击source code的链接，看看究竟他们是如何在.fit 方法中实现它的（GaussianNB 以示例为目的链接）
@G.Anderson 感谢您的回复。我是朴素贝叶斯的新手，我只需要知道我是否需要计算使用朴素贝叶斯分类的权重和偏差，或者我只需要比较一个句子的两个条件概率是正面还是负面，然后选择最高的作为预测类？

【解决方案1】：

在逻辑回归或 SVM 的情况下，模型试图预测最适合数据的超平面。所以这些模型将决定weights and biases。

测试示例：This movie is great
删除停用词后：movie great
从训练数据中，我们已经知道 movie 和 great 两个词对于 +ve 和 -ve 类的概率值。参考STEP 2。
+ve 类的great 概率将大于-ve 类的great 概率。对于movie 这个词，概率值可能几乎相同。（这在很大程度上取决于您的训练数据。这里我只是做一个假设）

正类概率 = P(movie/+ve) * P(great/+ve)

负类概率 = P(movie/-ve) * P(great/-ve)

附言

如果句子中的单词数量很大，那么类值会变得非常非常小。使用log 可以解决这个问题。

如果训练集中没有单词great，则类概率值为0。所以使用smoothening factor-α（拉普拉斯平滑）

更多详细信息请参考sk-learn naive bayes

【讨论】：