使用 NaiveBayes 实现期望最大化算法答案

【问题标题】：Expectation maximization algorithm implementation with NaiveBayes使用 NaiveBayes 实现期望最大化算法
【发布时间】：2012-03-04 04:31:00
【问题描述】：

我已经实现了具有良好文本过滤的 Naive-Bayes 文档分类，并且我接受了具有良好准确性的统计结果，我需要使用 EM 算法来增强我的结果。

但我不知道我是否可以将 EM 算法与朴素贝叶斯结果一起应用，或者将算法应用于数据并重新开始，因此我可以比较结果

在这两种情况下，我都需要理解这个问题上的 EM 算法，因为这真的让我很困惑

任何解释清楚的文件将不胜感激

【问题讨论】：

【解决方案1】：

EM 通常可以帮助您处理未标记的数据。如果你有一些未标记的数据，你基本上像这样循环使用它

estimate some initial parameters, perhaps even randomly
while not converged:
  relabel data using estimates
  update estimates using new labels

如果您在进行监督学习，那么重新标记步骤会吹走您的标签，并且可能会使您的分类变得更糟。

另一方面，这个is a nice, detailed tutorial on semi-supervised naive bayes 用于文本分类。如果您有少量标记文档和大量未标记文档，则可以使用它们来估计初始参数，然后对未标记数据进行迭代步骤，最终得到更好的分类器。

【讨论】：