【问题标题】:How to plot a decision boundary of random forest model如何绘制随机森林模型的决策边界
【发布时间】:2015-09-23 10:18:49
【问题描述】:

我有

## Classification:
library("randomForest")
data=iris
data<-data[data$Species!="setosa",]
data$Species<-factor(as.character(data$Species))
iris.rf <- randomForest(Species ~ Sepal.Length+Petal.Length, data=data, importance=TRUE,            proximity=TRUE)

我想构造一个带有决策边界的Sepal.Length~Petal.Length。这将是一个什么样的边界? 2 个类别中的每一个的概率为 0.5?

【问题讨论】:

    标签: r plot random-forest decision-tree


    【解决方案1】:

    您有一个随机森林,因此不一定有一个明确的决策边界,就像您从 SVM 等非概率线性分类器中获得的那样。但是你可以用类似的东西来绘制它......

    library(ggplot2)
    ggplot(data=data,aes(x=Petal.Length, y=Sepal.Length, color= iris.rf$predicted) ) + 
           geom_point()
    

    在这种情况下是的,因为你只在两个类上训练它,颜色变化表示的边界发生在 0.5。

    【讨论】:

    • 如果您输入 RF 模型 newdata=data.frame(expand.grid(Sepal.Length=seq(5,8,0.1), Petal.Length=seq(3,7,0.1)) ) 你不应该能够在 Sepal.Length ~ Petal.Length 平面上获得决策边界吗?
    • 你想得到看起来像第三个数字here的东西吗?
    • 如果x轴和y轴是RF模型的2个自变量,是的。
    猜你喜欢
    • 2019-09-09
    • 2017-03-15
    • 2017-12-20
    • 2016-07-12
    • 2017-05-03
    • 2017-10-20
    • 2018-04-19
    • 2012-12-10
    • 1970-01-01
    相关资源
    最近更新 更多