【问题标题】:How to interpret an unusual decision tree output (multi-classes) using rpart如何使用 rpart 解释不寻常的决策树输出(多类)
【发布时间】:2018-02-25 19:40:28
【问题描述】:

我正在尝试使用 rpart 包绘制决策树,并且真的对其输出感到困惑。值得注意的是,在第三节点,如何从城市生产农业和采矿类?

我认为应该是农业和城市,而不是农业和采矿业。 这是我的代码

df<-read.csv("https://raw.githubusercontent.com/tuyenhavan/Statistics/Dataset/Landsat_Data.csv")

library(rpart)

library(rpart.plot)
set.seed(123)

dt<-rpart(Land_cover~., data=df)

rpart.plot(dt,cex=0.35)

请帮我解释一下。谢谢

【问题讨论】:

    标签: decision-tree explain rpart


    【解决方案1】:

    节点显示所有响应类别的相对频率以及多数投票,即最频繁的类别。如果存在平局,则最常见的类别中的第一个将显示为多数票(当然,这是一个有点武断的选择)。

    因此,在根节点中,所有类别都以 20% 的相同频率出现,并且“农业”显示为多数票,因为它在字典上是第一个类别。

    类似地,在节点 3(对于 Band1 >= 0.03599656)“城市”和“水”仍然与最常见的类别相关(200 个观测值 = 24.969%)。因此,“城市”被列为多数票。

    【讨论】:

      猜你喜欢
      • 2013-04-09
      • 2018-06-13
      • 1970-01-01
      • 2017-11-26
      • 2019-11-19
      • 2021-12-10
      • 2019-02-11
      • 2019-01-14
      • 2021-05-21
      相关资源
      最近更新 更多