【问题标题】:Weka OneR gives ? as classifier modelWeka OneR 给 ?作为分类器模型
【发布时间】:2018-01-28 02:15:24
【问题描述】:

我的 Weka OneR 模型都返回了看起来像是过拟合的集合,以一个问号结束,导致如下特定结果:

FollowersMeanCoords_Col:
    < 0.33340000000000003   -> False
    >= 0.33340000000000003  -> True
    ?   -> False
(114357/163347 instances correct)

这个 OneR 是否只是在说“我找不到任何东西,所以我们假设其余的都是假的”?但是,为什么日期有一个明确的界限(低于 0.33 的都是 False,高于或等于 True)?有没有办法防止这种情况发生?

提前致谢!

【问题讨论】:

标签: machine-learning classification weka


【解决方案1】:

? 指的是缺失值 - 在某些情况下,您的训练数据必须缺少一些 FollowersMeanCoords_Col 值。

您问题中的模型表示,如果某个实例(数据点)的FollowersMeanCoords_Col 小于 0.3334...,或缺失,它将将该实例分类为False,否则会归类为True

OneR 是一种非常简单的分类算法,它通过从训练数据中找到一个在用于制定分类规则时误差最小的属性来工作。 OneR 要过拟合,需要有一个属性恰好可以很好地分类训练数据,但不能推广到未来的测试数据。 OneR 更有可能为您提供稳健但不准确的模型。

【讨论】:

    猜你喜欢
    • 2015-11-12
    • 2014-04-05
    • 2014-10-12
    • 2016-10-24
    • 2015-02-05
    • 2023-04-08
    • 2013-03-10
    • 2012-06-02
    • 2014-05-07
    相关资源
    最近更新 更多