【问题标题】:GBM model : why is the validation accuracy fluctuating on grid search in h2o RGBM 模型:为什么验证精度在 h2o R 中的网格搜索上会波动
【发布时间】:2019-01-30 23:34:14
【问题描述】:

我在 R 中使用 H2O 包,我正在尝试使用 gbm 模型提高我的分数。我尝试使用训练集和有效集进行网格搜索。 但是当它完成时,两组之间的对数损失曲线是非常不同的。事实上,我的训练集存在过度拟合,因此准确度高于我的有效集

Here on H2O, my gbm's parameters :
ntrees = 100, 
max_depth = 3, 
learn_rate = 0.01, 
nfolds = 5,
seed = 1234

你能给我一些方法来解决我的问题吗?

【问题讨论】:

    标签: r h2o


    【解决方案1】:

    有关在 R 中调整 H2O GBM 的帮助,我建议查看此调整指南:https://github.com/h2oai/h2o-3/blob/master/h2o-docs/src/product/tutorials/gbm/gbmTuning.Rmd

    从您使用的预测变量、您设计的功能、您拆分数据的方式以及您调整模型的方式中,您可能会看到过度拟合的原因有很多。

    如果不查看您的特定数据集和您运行的特定代码,就很难为您提供过度拟合问题的确切原因。

    【讨论】:

      猜你喜欢
      • 2018-12-22
      • 2016-06-10
      • 2022-01-19
      • 1970-01-01
      • 1970-01-01
      • 2018-03-07
      • 2020-11-04
      • 2015-10-07
      • 2020-11-28
      相关资源
      最近更新 更多