【发布时间】:2017-04-17 15:43:06
【问题描述】:
如果某些预测变量的列中有 NaN 值,我如何使用 randomForest 库在 R 中运行随机森林。
rf <- randomForest(class ~ maxf + minf + d + startf + endf + f1.4 + f1.2 + f3.4 + minslope + maxslope+ bslope + eslope + avgsl + noex + noip, data=whistles_nov, importance=TRUE)
给出这个错误:
Error in na.fail.default(list(class = c(6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, :
missing values in object
matlab 中的 TreeBagger 函数是否与 NaN 值无关?
【问题讨论】:
-
首先使用 rfImpute 估算 mssing 值
-
我会使用适当的插补方法(或者如果可以接受,则删除具有 NaN 值的行)来运行它。如果它是一个类变量,您可能只需添加一个新的“缺失”类别。如果您在多个数值列中有大量缺失值,则可能会因为随机森林的工作方式而变得复杂。
标签: r matlab cart random-forest