【问题标题】:R package "tree": how to control the maximum tree depth?R包“树”:如何控制最大树深度?
【发布时间】:2015-10-11 12:51:38
【问题描述】:

R 包“tree”将最大树深度限制为 31。如果将函数 tree 应用于大型数据集,则很容易达到此限制:

> library("tree")
> library("ElemStatLearn")
> data <- list(image=as.matrix(zip.train[,-1]), digit=as.factor(zip.train[,1]))
> t <- tree(digit~image, data, split="gini")
Error in tree(digit ~ image, data, split = "gini") : 
  maximum depth reached
Calls: source -> withVisible -> eval -> eval -> tree -> .C

有没有办法告诉tree 在达到最大树深度时停止生长树,而不是因错误而中止? (换句话说:rpart.controlmaxdepth 参数是否有等价物?)

【问题讨论】:

  • 查看?tree?tree.control设置参数。
  • 我阅读了帮助页面,但没有找到相关参数。也许我忽略了什么?
  • 这有没有解决?
  • @Vincent 我个人的结论是使用“rpart”而不是“tree”。
  • @Vincent tree 和 rpart 是两个相互竞争的包,它们都可以构建分类树。他们做事略有不同,通过实验,我(或者更确切地说是我的一个学生)得到的印象是 rpart 通常看起来比 tree 更精致。所以我的结论是:停止使用 tree 包,开始使用 rpart 包。 rpart 的文档在这里:cran.r-project.org/web/packages/rpart/rpart.pdf

标签: r classification


【解决方案1】:

我同意@jochen 的建议,即rpart 包似乎比tree 包更精致。但是,tree 包似乎在一些小事情上做得更好。 例如,为tree 对象绘制决策边界要比为rpart 对象绘制决策边界要容易得多(尤其是使用ggplot)。 关于文森特的问题,我通过使用tree.control(min.cut=) 选项控制tree 树的深度取得了一些有限的成功,如下面的代码所示。通过更改终端节点中元素的最小数量,您可以对深度进行有限控制。

library("ElemStatLearn")
 library("tree")
 data <- list(image=as.matrix(zip.train[,-1]), digit=as.factor(zip.train[,1]))
 t <- tree(digit~image, data, split="gini", control=tree.control(1866496, mincut = 1000))
 library(maptree)
 draw.tree(t)

【讨论】:

    猜你喜欢
    • 2017-03-26
    • 2011-02-04
    • 2014-12-04
    • 2015-02-12
    • 2016-10-18
    • 1970-01-01
    • 2016-01-24
    • 2014-02-09
    • 2016-08-26
    相关资源
    最近更新 更多