【发布时间】:2016-07-23 22:06:44
【问题描述】:
我需要从决策树的规则中提取信息。我在 R 中使用 rpart 包。我使用包中的演示数据来解释我的要求:
data(stagec)
fit<- rpart(formula = pgstat ~ age + eet + g2 + grade + gleason + ploidy, data = stagec, method = "class", control=rpart.control(cp=0.05))
fit
印花合身展示
n= 146
node), split, n, loss, yval, (yprob)
* denotes terminal node
1) root 146 54 0 (0.6301370 0.3698630)
2) grade< 2.5 61 9 0 (0.8524590 0.1475410) *
3) grade>=2.5 85 40 1 (0.4705882 0.5294118)
6) g2< 13.2 40 17 0 (0.5750000 0.4250000)
12) ploidy=diploid,tetraploid 31 11 0 (0.6451613 0.3548387) *
13) ploidy=aneuploid 9 3 1 (0.3333333 0.6666667) *
7) g2>=13.2 45 17 1 (0.3777778 0.6222222)
14) g2>=17.91 22 8 0 (0.6363636 0.3636364) *
15) g2< 17.91 23 3 1 (0.1304348 0.8695652) *
例如我想为第 12 个节点获取如下信息
如果等级>=2.5 且 g2
谢谢
【问题讨论】:
-
也许你可以使用
list.rules.rpart()作为基础:library(rpart);fit <- rpart(Kyphosis ~ Age + Number + Start, data = kyphosis);list.rules.rpart(fit)。
标签: r machine-learning classification decision-tree