【问题标题】:How does H2O AutoML treat factor variables?H2O AutoML 如何处理因子变量?
【发布时间】:2019-06-17 09:57:27
【问题描述】:

我目前正在使用H2O's AutoML 进行数据科学项目。但是,在文档、互联网或代码中,我找不到 AutoML 如何处理因子变量的任何地方——它是否进行一次性编码?标签编码?更高级的东西?它是否考虑有多少级别?取决于算法吗?

目前,AutoML 的表现非常糟糕(略高于基线),我怀疑这是因为它没有正确处理分类变量,而分类变量约占我预测变量的 90%。

【问题讨论】:

    标签: machine-learning neural-network h2o xgboost automl


    【解决方案1】:

    AutoML 自动运行 H2O-3 中可用的监督学习模型。因此,AutoML 如何处理分类取决于它正在运行的给定模型的默认分类处理。可以找到有关处理分类值的文档here,如果您对特定算法感兴趣,请使用相同的文档来查找您感兴趣的算法并查看它如何处理分类值的详细信息,或者使用 Python 或 R API 文档查看增加默认值。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2016-08-02
      • 1970-01-01
      • 2023-03-16
      • 2021-10-03
      • 1970-01-01
      • 2018-01-21
      • 2021-04-30
      • 2021-10-12
      相关资源
      最近更新 更多