【问题标题】:Expectation maximization algorithm implementation with NaiveBayes使用 NaiveBayes 实现期望最大化算法
【发布时间】:2012-03-04 04:31:00
【问题描述】:

我已经实现了具有良好文本过滤的 Naive-Bayes 文档分类,并且我接受了具有良好准确性的统计结果,我需要使用 EM 算法来增强我的结果。

但我不知道我是否可以将 EM 算法与朴素贝叶斯结果一起应用,或者将算法应用于数据并重新开始,因此我可以比较结果

在这两种情况下,我都需要理解这个问题上的 EM 算法,因为这真的让我很困惑

任何解释清楚的文件将不胜感激

【问题讨论】:

    标签: php statistics document-classification expectation-maximization


    【解决方案1】:

    EM 通常可以帮助您处理未标记的数据。如果你有一些未标记的数据,你基本上像这样循环使用它

    estimate some initial parameters, perhaps even randomly
    while not converged:
      relabel data using estimates
      update estimates using new labels
    

    如果您在进行监督学习,那么重新标记步骤会吹走您的标签,并且可能会使您的分类变得更糟。

    另一方面,这个is a nice, detailed tutorial on semi-supervised naive bayes 用于文本分类。如果您有少量标记文档和大量未标记文档,则可以使用它们来估计初始参数,然后对未标记数据进行迭代步骤,最终得到更好的分类器。

    【讨论】:

    • 感谢您的链接,所以我无法将 EM 与 NB 结果合并,以免我的结果变得粗糙,如果您对 EM 了解很多,您认为值得尝试并在它们之间进行比较吗?
    • NB 是分类器,EM 是推理算法。你到底想比较什么?
    猜你喜欢
    • 2020-02-10
    • 2013-02-09
    • 2011-07-14
    • 2013-01-26
    • 2013-05-23
    • 2021-05-03
    • 2016-09-07
    • 1970-01-01
    • 2019-03-24
    相关资源
    最近更新 更多