【发布时间】:2015-09-17 20:21:01
【问题描述】:
我对具有重要性/varImPlot 功能的随机森林有疑问,希望有人能帮助我解决吗?
我尝试编写版本,但我对(不同的)结果感到困惑:
1.)
rffit = randomForest(price~.,data=train,mtry=x,ntree=500)
rfvalpred = predict(rffit,newdata=test)
varImpPlot(rffit)
importance(rffit)
显示“重要性”的图和数据,但仅显示“IncNodePurity”。并且数据与情节和数据不同,我尝试使用“Scale”但没有奏效。
2.)
rf.analyzed_data = randomForest(price~.,data=train,mtry=x,ntree=500,importance=TRUE)
yhat.rf = predict(rf.analyzed_data,newdata=test)
varImpPlot(rf.analyzed_data)
importance(rf.analyzed_data)
在这种情况下,它不再生成任何图,并且重要性数据显示“%IncMSE”和“IncNodePurity”数据,但“IncNodePurity”数据与第一个代码不同? 问题: 1.) 知道为什么“IncNodePurity”的数据不同吗? 2.) 知道为什么第一个版本中没有显示“%IncMSE”吗? 3.) 为什么第二个版本没有剧情?
非常感谢!! 埃德
【问题讨论】:
标签: r tree random-forest