【发布时间】:2017-11-26 11:16:21
【问题描述】:
我们如何使用“rpart”包指定参数“minsplit=”来执行决策树。
rpart(myFormula, data=train, control=rpart.control(minsplit=10))
【问题讨论】:
标签: decision-tree
我们如何使用“rpart”包指定参数“minsplit=”来执行决策树。
rpart(myFormula, data=train, control=rpart.control(minsplit=10))
【问题讨论】:
标签: decision-tree
minsplit :- 节点中必须存在的最小观察数才能尝试拆分。 (https://stat.ethz.ch/R-manual/R-devel/library/rpart/html/rpart.control.html)
您可以通过指定自己的值来覆盖 minsplit 控制参数。但请注意,这可能会导致过度拟合的决策树。例如,如果您的数据点很少,不足以创建具有 RPART 的默认参数集的树;然后你可以调整minsplit、minbucket的值来创建树。
您可以在查看数据集后决定值。
RPART 的默认值:- minsplit = 20, minbucket = round(minsplit/3)
树
【讨论】: