【发布时间】:2016-11-10 22:15:07
【问题描述】:
我是 h2o 的新手,我在 r 上使用这个包时遇到了困难。
我分别使用带有 18917 个变量和二进制目标 (0,1) 的训练和测试集 5100 和 2300 obs
我跑了一个随机森林:
train_h20<-as.h2o(train)
test_h20<-as.h2o(test)
forest <- h2o.randomForest(x = Words,
y = 18918,
training_frame = train_h20,
ntree = 250,
validation = test_h20,
seed = 8675309)
我知道我可以得到 logloss 或 mse 或 ... 随着树数变化的图 但是有没有办法绘制模型本身的图像。我的意思是用于最终预测的最终集成树?
另外,另一个问题,在randomForest 包中,我可以使用返回我的varImp 函数,以及绝对重要性、特定于类的度量(计算为准确度的平均下降),我解释为一个类- 变量重要性的相对度量。
varImp 矩阵,randomForest 包:
在h2o 包中,我只找到绝对重要性度量,有类似的吗?
【问题讨论】:
-
最好把你的两个问题当作两个问题来问。 (请参阅meta.stackexchange.com/a/39224/167713 了解原因。)H2O 没有随机森林图;我已经看到了阅读原始 POJO 输出的建议! (不管怎样,除了玩具模型,你不会想要这样做。)
标签: r random-forest h2o