【发布时间】:2019-03-15 13:41:13
【问题描述】:
如何计算h2o.gbm的条件排列重要性?
我有一个包含许多高度相关变量的数据集(>0.9)。并将这个数据集提供给h2o.gbm。事实证明,当我下拉相关变量时,RMSE 会增加(在 CV 上)。
现在我正在尝试获取变量重要性并发现了这个函数:h2o.varimp()。这(我猜)与经典的party::varimp(model, conditional = T) 不同。
【问题讨论】:
如何计算h2o.gbm的条件排列重要性?
我有一个包含许多高度相关变量的数据集(>0.9)。并将这个数据集提供给h2o.gbm。事实证明,当我下拉相关变量时,RMSE 会增加(在 CV 上)。
现在我正在尝试获取变量重要性并发现了这个函数:h2o.varimp()。这(我猜)与经典的party::varimp(model, conditional = T) 不同。
【问题讨论】:
这是一个重复的问题,您可以找到以前发布的答案here 和here。
简短的回答是目前 H2O-3 中没有此选项,有关替代选项,请参阅上面的链接问题。
此外,还为此问题创建了一个 jira 票证,您可以在此处跟踪和评论:https://0xdata.atlassian.net/browse/PUBDEV-4027
【讨论】: