【发布时间】:2013-01-29 14:34:08
【问题描述】:
检查我的模型的统计数据时,confusion matrix 中的数字似乎与randomForest 中的OOB error rate 的数字不一致。
如何从混淆矩阵中推导出OOB错误率?它们之间有什么关系?
在下面的示例中,我打印了两个模型的输出,一个适合分层抽样(使用sampsize 中的样本子集),另一个不适合(即使用默认抽样方案,即我认为使用所有样本)。
我没有公开数据,但这里是函数调用:
sumY = summary(Y)
sampsize <- c(sumY["Y0"]/10, sumY["Y1"])
# First model in the image above
strat.rf.model <- randomForest(x=X,y=Y,sampsize=sampsize, strata=Y)
# Second model in the image above
rf.model <- randomForest(x=X,y=Y)
【问题讨论】:
标签: r random-forest