如何绘制随机森林模型的决策边界

【问题标题】：How to plot a decision boundary of random forest model如何绘制随机森林模型的决策边界
【发布时间】：2015-09-23 10:18:49
【问题描述】：

我有

## Classification:
library("randomForest")
data=iris
data<-data[data$Species!="setosa",]
data$Species<-factor(as.character(data$Species))
iris.rf <- randomForest(Species ~ Sepal.Length+Petal.Length, data=data, importance=TRUE,            proximity=TRUE)

我想构造一个带有决策边界的Sepal.Length~Petal.Length。这将是一个什么样的边界？ 2 个类别中的每一个的概率为 0.5？

【问题讨论】：

标签： r plot random-forest decision-tree

【解决方案1】：

您有一个随机森林，因此不一定有一个明确的决策边界，就像您从 SVM 等非概率线性分类器中获得的那样。但是你可以用类似的东西来绘制它......

library(ggplot2)
ggplot(data=data,aes(x=Petal.Length, y=Sepal.Length, color= iris.rf$predicted) ) + 
       geom_point()

在这种情况下是的，因为你只在两个类上训练它，颜色变化表示的边界发生在 0.5。

【讨论】：

如果您输入 RF 模型 newdata=data.frame(expand.grid(Sepal.Length=seq(5,8,0.1), Petal.Length=seq(3,7,0.1)) ) 你不应该能够在 Sepal.Length ~ Petal.Length 平面上获得决策边界吗？
你想得到看起来像第三个数字here的东西吗？
如果x轴和y轴是RF模型的2个自变量，是的。