【问题标题】:Wrong labels in rpart treerpart 树中的错误标签
【发布时间】:2018-11-09 04:23:23
【问题描述】:

在 R 中使用 rpart 时遇到了一些标签问题。

这是我的情况。

我正在处理一个包含分类变量的数据集,这是我的数据摘录

head(Dataset)
Entity  IL  CP  TD  Budget 
  2      1   3   2     250
  5      2   2   1     663
  6      1   2   3     526 
  2      3   1   2     522

当我绘制添加标签的决策树时,使用

plot(tree) 
text(tree)

我得到错误的标签:对于实体,我得到“abcd”

为什么会这样,我该如何解决?

感谢您的帮助

【问题讨论】:

    标签: r tree visualization labels rpart


    【解决方案1】:

    默认情况下,plot.rpart 只会用letters 标记因子变量的级别,第一个级别是a,第二个是b,依此类推。示例:

    library(rpart)
    library(ggplot2) #for the data
    
    data("diamonds")    
    df <- diamonds[1:2000,]
    
    fit <- rpart(price ~ color + cut + clarity, data = df)
    plot(fit)
    text(fit)
    

    在我看来,不要自定义此绘图,而是使用 rpart 绘图专用包:

    library(rpart.plot)
    prp(fit)
    

    它有许多自定义选项(示例):

    prp(fit,
        type = 4,
        extra = 101,
        fallen.leaves = T,
        box.palette = colorRampPalette(c("red", "white", "green3"))(10),
        round = 2,
        branch.lty = 2,
        branch.lwd = 1,
        space = -1,
        varlen = 0,
        faclen = 0)
    

    另一个选项是:

    library(rattle)
    fancyRpartPlot(fit,
                   type = 4)
    

    在内部使用 prp 并具有不同的默认值。

    【讨论】:

      猜你喜欢
      • 2015-01-08
      • 2018-10-21
      • 2015-05-25
      • 2015-10-28
      • 2021-02-14
      • 2015-09-18
      • 2015-03-07
      • 2016-04-09
      • 2014-08-14
      相关资源
      最近更新 更多