【发布时间】:2018-07-16 15:33:28
【问题描述】:
我正在 h2o 中对 GBM 执行网格搜索,以获得具有连续预测变量的连续结果。我正在使用交叉验证进行训练,然后在测试集上进行预测。
我正在使用函数 .predict_leaf_node_assignment:
best_gbm.predict_leaf_node_assignment(test_frame_h2o) (其中 best_gbm 是我从 gridsearch 得到的最好的 gbm 模型)
并得到下表,我们可以在其中看到每棵树 T1、T2、T3 等的叶节点分配。
问题一:
如何获取下表中每个叶子的 T1、T2、T3 等值,而不是叶子的位置?
问题 2:
如果有办法获取 T1、T2、T3 等的值,它们实际上反映了什么? T1 是第一个预测,然后 T2、T3、T4 是更正吗?还是 T1 是预测,然后 T2 是 T1 校正等?
谢谢。
编辑:我尝试按照此页面中的说明在 python 中下载 mojo,以便我可以查看不同的树。 http://docs.h2o.ai/h2o/latest-stable/h2o-docs/productionizing.html?highlight=mojo
在“步骤 2:编译并运行 MOJO”中,此步骤的第二部分仅在 R 中给出: “通过创建一个名为 main.java 的新文件(例如,使用“vim main.java”)在实验文件夹中创建你的主程序。包括以下内容。请注意,此文件引用了上面使用 R 创建的 GBM 模型。
我可以在 python 中做到这一点吗? 例如,我试图在 jupyter 笔记本中复制命令“import java.io.*”,但它会引发错误(ModuleNotFoundError: No module named 'java')。
【问题讨论】:
标签: python-3.x h2o gbm