【发布时间】:2015-03-07 21:00:36
【问题描述】:
在 R 包 rpart 中,决定树的 CP 表中呈现的树的大小是什么?在下面的示例中,CP 表默认仅显示具有 1、2 和 5 个节点的树(分别为 nsplit = 0、1 和 4)。
library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start, method="class", data=kyphosis)
> printcp(fit)
Classification tree:
rpart(formula = Kyphosis ~ Age + Number + Start, data = kyphosis,
method = "class")
Variables actually used in tree construction:
[1] Age Start
Root node error: 17/81 = 0.20988
n= 81
CP nsplit rel error xerror xstd
1 0.176471 0 1.00000 1.00000 0.21559
2 0.019608 1 0.82353 0.94118 0.21078
3 0.010000 4 0.76471 0.94118 0.21078
是否有一个固有规则rpart() 用于确定要呈现的树的大小?是否可以强制 printcp() 返回所有可能大小的树的交叉验证统计信息,即对于上面的示例,还包括具有 3 个和 4 个节点的树的行 (nsplit = 2, 3)?
【问题讨论】:
标签: r tree decision-tree cross-validation rpart