【问题标题】:how to decide 'minsplit' using rpart in decision tree?如何在决策树中使用 rpart 来决定“minsplit”?
【发布时间】:2017-11-26 11:16:21
【问题描述】:

我们如何使用“rpart”包指定参数“minsplit=”来执行决策树。

rpart(myFormula, data=train, control=rpart.control(minsplit=10))

【问题讨论】:

    标签: decision-tree


    【解决方案1】:

    minsplit :- 节点中必须存在的最小观察数才能尝试拆分。 (https://stat.ethz.ch/R-manual/R-devel/library/rpart/html/rpart.control.html)

    您可以通过指定自己的值来覆盖 minsplit 控制参数。但请注意,这可能会导致过度拟合的决策树。例如,如果您的数据点很少,不足以创建具有 RPART 的默认参数集的树;然后你可以调整minsplit、minbucket的值来创建树。

    您可以在查看数据集后决定值。

    RPART 的默认值:- minsplit = 20, minbucket = round(minsplit/3)

    【讨论】:

      猜你喜欢
      • 2013-02-09
      • 2019-02-11
      • 2021-05-30
      • 2016-07-24
      • 2013-05-01
      • 2016-10-09
      • 2015-06-16
      • 2015-01-08
      • 2017-09-08
      相关资源
      最近更新 更多