【问题标题】:Export a Classifier to Human-Readable File将分类器导出到人类可读文件
【发布时间】:2013-11-24 08:49:39
【问题描述】:

我在 NLP 中有一项任务是训练分类器并将其导出为人类可读的格式。这样做的最佳应用程序是什么。

我尝试使用 NLTK,但它没有导出为人类可读格式的功能,例如

这是一个分类器

classifier = nltk.NaiveBayesClassifier.train(train_set)

我需要它来保存并稍后用于我自己的需要,而无需与 NLTK 有任何联系

我知道 pickle 技巧,但它并不是完全可读的。

用于训练分类器并将其导出到文件的最佳和舒适工具是什么。

【问题讨论】:

    标签: machine-learning nlp


    【解决方案1】:

    xhudik 是正确的。贝叶斯将成为一种黑盒算法,但如果我正确理解您的意图——您可能想了解某些单词/特征输入的系数,为什么不直接浏览模型?即使使用朴素贝叶斯,您也可以检查分类器输出的似然值并将其序列化到文件中。

    示例:您有 3 个类:A、B 和 C

            A     B      C
    n1 ->  .2    .6     .2
    n2 ->  .5    .1     .4
    .
    .
    .
    


    read more here

    【讨论】:

      【解决方案2】:

      您似乎并没有真正了解您要做什么。如果我理解正确 - 您想查看您的训练模型/分类器的工作精度如何

      在这种情况下,您不应该关心您使用什么类型的软件包,而是部署什么算法。这意味着你不应该使用所谓的黑盒算法,例如神经网络、贝叶斯……尝试使用决策树(例如 J48)——它会给你一个指导(人类可读的)知识它是如何工作的。

      【讨论】:

      • 朴素贝叶斯与任何回归一样远离“黑盒”。它非常易于解释!
      猜你喜欢
      • 2013-07-06
      • 1970-01-01
      • 1970-01-01
      • 2014-09-18
      • 2020-03-09
      • 2013-02-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多