【问题标题】:Odd estimations by Naive Bayes Classificator朴素贝叶斯分类的奇数估计
【发布时间】:2016-05-05 12:45:54
【问题描述】:

我目前正在尝试训练一个朴素贝叶斯分类器,以帮助我对数据集进行分类。每个数据集都是一个包含不同可能事件的日志。我总共有大约 150 个事件被我编码为日志的属性,因此它显示了它们发生的频率。

我总共有大约 600 个可用的数据集,其中 400 个用于训练子集,其余 200 个用于测试子集。

在创建模型并将其应用于测试子集时,会发生一些奇怪的事情:大多数测试数据集被归类为在训练数据集中以最低频率出现的类别。 大多数在训练数据中表现得很好的类根本不会显示为分类结果。不是你所期望的,也不是正确的。

如果需要代码,我会稍后发布 - 但我认为这与朴素贝叶斯的工作方式以及我的数据结构有关。

感谢您的帮助!

【问题讨论】:

  • 我认为我的问题与所谓的 Skewed data bias 有关。我将尝试应用另一种分类方法。

标签: r machine-learning naivebayes


【解决方案1】:

您可以轻松调试天真贝叶斯(它不是黑匣子分类器,与神经网络不同,它是Nb的大的优势)。

培训后,它看起来给出了一个类的特征的经验日志概率,p(x_i | y)。它的形状(n_classes, n_features)。 在那后看看错误的示例功能,你可以看到为什么错误的类。

【讨论】:

  • 我该怎么做?如果我创建bayes_obj 987654323 @,我知道我可以使用bayes_obj$table来访问它的表。是这个意思吗?
猜你喜欢
  • 2014-11-03
  • 1970-01-01
  • 2016-10-05
  • 2014-09-18
  • 2021-09-05
  • 2015-08-27
  • 2012-07-02
  • 2017-01-10
相关资源
最近更新 更多