【发布时间】:2019-06-17 09:57:27
【问题描述】:
我目前正在使用H2O's AutoML 进行数据科学项目。但是,在文档、互联网或代码中,我找不到 AutoML 如何处理因子变量的任何地方——它是否进行一次性编码?标签编码?更高级的东西?它是否考虑有多少级别?取决于算法吗?
目前,AutoML 的表现非常糟糕(略高于基线),我怀疑这是因为它没有正确处理分类变量,而分类变量约占我预测变量的 90%。
【问题讨论】:
标签: machine-learning neural-network h2o xgboost automl