【问题标题】:H2o Parser issueH2o 解析器问题
【发布时间】:2018-02-01 08:26:55
【问题描述】:

使用 H2o 3.16.0.4 解析 Kaggle Toxic 数据分类器竞赛。即使将解析器用作 csv 并将分隔符用作“,”,数据也不会被解析。如果这是与产品相关的错误或缺少某些配置,请告诉我。

【问题讨论】:

    标签: h2o


    【解决方案1】:

    问题可能是注释字段的换行符过多,因此很遗憾更改分隔符无济于事。

    作为一种解决方法,您可以使用 pandas.read_csv()(正确解析)导入带有 pandas 的 csv(注意:它在 data.table::fread()reported here 中都不起作用)。

    要使用 H2O 中的数据框进行建模,只需将数据框转换为 H2O 框(在 Python 中使用df = h2o.H2OFrame(my_pandas_frame)

    我创建了一个JIRA ticket,以便跟踪和处理此问题。

    【讨论】:

    • 感谢解决方案,如果不删除换行符,通过pandas数据框导入也有同样的问题,在pandas数据框中删除这些字符后,可以正确导入和解析。这帮助我继续前进。
    猜你喜欢
    • 2020-10-19
    • 2020-01-18
    • 2011-08-02
    • 2012-02-29
    • 2011-01-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多