【问题标题】:Why my decision tree have not node? (C5.0)为什么我的决策树没有节点? (C5.0)
【发布时间】:2020-06-03 14:48:28
【问题描述】:

我有 6 个属性的 204 个数据。

当我使用此脚本创建包含所有数据的模型时,model = C5.0(dataset1[,-7], dataset1[,7]), 结果给我没有像下图这样的节点。

但是,如果我在这个脚本中只使用 100 个数据,model = C5.0(dataset1[1:100,-7], dataset1[1:100,7]),结果会给我一个很好的决策树,如下图所示。

有什么问题?问题出在数据上吗? 谢谢。

【问题讨论】:

    标签: r classification data-mining decision-tree c5.0


    【解决方案1】:

    检查树木的展示,很容易看出发生了什么。 仅使用 100 点的第二个模型并不比第一个更好。 当您向 C5.0 提供更多数据时,它正确确定了一个更简单的模型 是优越的。看看结果。

    第一棵树(所有 204 分)预测一切都是 Lancar 给予的 错误率为 27%(204 个错误中有 55 个错误)。

    第二棵树的错误率是多少?

    节点 2 预测 Lancar 55 个点,错误率为 25.5%(14 个错误)。
    节点 4 预测 Lancar 25 个点,错误率为 28.0%(7 个错误)。
    节点 6 预测 Macet 的 8 个点,错误率为 50.0%(4 个错误)。
    节点 7 预测 Macet 为 12 个点,错误率为 41.7%(5 个错误)。
    总错误 100 个中有 30 个或 30.0% - 比 27% 的错误率更差 对于更简单的模型。 C5.0 简单地确定了可用的最佳模型是预测所有点都属于多数类(Lancar)。

    【讨论】:

      猜你喜欢
      • 2022-12-17
      • 2020-12-17
      • 2014-05-13
      • 2015-12-18
      • 2018-11-15
      • 2015-01-31
      • 1970-01-01
      • 2017-09-19
      • 1970-01-01
      相关资源
      最近更新 更多