【问题标题】:How do I interpret rpart splits on factor variables when building classification trees in R?在 R 中构建分类树时,如何解释因子变量上的 rpart 拆分?
【发布时间】:2011-02-05 12:58:09
【问题描述】:

如果因子变量是气候,有 4 个可能的值:热带、干旱、温带、雪,并且我的 rpart 树中的一个节点被标记为“气候:ab”,那么拆分是什么?

【问题讨论】:

  • 这属于 stats.stackexchange.com,应该关闭。
  • @Joris 我不同意。问题是关于程序答案的解释,与分区树的统计背景和统计本身无关。
  • @Marek 你怎么称呼统计分析的解释?
  • @user281537 你至少可以给我们你提到的代码和输出。如果气候是 y 变量或您的 x 变量之一?如果它是“因素”变量,我希望它是响应变量。如果是,那么它不应该在节点的标签中,而只在叶子的标签中。构造指向某个交互项的方向。
  • @Marek : 你是不是巧合地跳出老问题?

标签: r rpart cart-analysis


【解决方案1】:

我假设您使用标准方法来绘制树,即

plot(f)
text(f)

正如您在text.rpart 的帮助中看到的那样,默认因子变量上的参数pretty 以字母表示,因此a 表示levels(Climate)[1],这意味着在左侧节点上使用Climate==levels(Climate)[1] 进行观察正确的其他人。

您可以直接使用打印级别

plot(f)
text(f, pretty=1)

但我建议使用来自maptree packagedraw.tree

require(maptree)
draw.tree(f)

我用假数据做图:

X <- data.frame(
    y=rep(1:4,25),
    Climate=rep(c("Tropical", "Arid", "Temperate", "Snow"),25)
)
f <- rpart(y~Climate, X)

【讨论】:

    猜你喜欢
    • 2013-04-09
    • 2015-01-11
    • 2015-02-17
    • 2015-09-18
    • 1970-01-01
    • 2018-01-10
    • 2015-07-04
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多