【发布时间】:2018-07-10 22:11:35
【问题描述】:
我的目标是创建一个partial dependence plot (PDP),它显示两个输入变量对我的 h2o 随机森林模型响应的交互作用。这是示例情况的可重现设置:
library(h2o)
data(diabetes, package = 'lars')
h2o.init()
train_data <- as.h2o(cbind(diabetes$x, target=diabetes$y))
X_names <- colnames(diabetes$x)
y_name <- "target"
rf <- h2o.randomForest(x=X_names, y=y_name, training_frame=train_data,
ntrees=10, max_depth=5)
h2o.partialPlot(rf, train_data, c("age", "bmi"))
上面的代码分别为age 和bmi 绘制了两个PDP,但它没有显示当它们一起变化时它们如何影响响应。
假设我想在 x 轴上绘制 age,在 y 轴上绘制 bmi,在 3 维图中绘制 z 轴上的平均响应。
在 h2o 中是否有功能(或良好实践指南)可以帮助构建这样的图?我可以通过自己创建响应数据来解决问题,但这会有点麻烦。
查看相关:
https://stats.stackexchange.com/questions/197455/how-to-plot-3d-partial-dependence-in-gbm
【问题讨论】:
标签: r machine-learning h2o