【发布时间】:2018-02-01 08:26:55
【问题描述】:
使用 H2o 3.16.0.4 解析 Kaggle Toxic 数据分类器竞赛。即使将解析器用作 csv 并将分隔符用作“,”,数据也不会被解析。如果这是与产品相关的错误或缺少某些配置,请告诉我。
【问题讨论】:
标签: h2o
使用 H2o 3.16.0.4 解析 Kaggle Toxic 数据分类器竞赛。即使将解析器用作 csv 并将分隔符用作“,”,数据也不会被解析。如果这是与产品相关的错误或缺少某些配置,请告诉我。
【问题讨论】:
标签: h2o
问题可能是注释字段的换行符过多,因此很遗憾更改分隔符无济于事。
作为一种解决方法,您可以使用 pandas.read_csv()(正确解析)导入带有 pandas 的 csv(注意:它在 data.table::fread() 或 reported here 中都不起作用)。
要使用 H2O 中的数据框进行建模,只需将数据框转换为 H2O 框(在 Python 中使用df = h2o.H2OFrame(my_pandas_frame)。
我创建了一个JIRA ticket,以便跟踪和处理此问题。
【讨论】: