【问题标题】:How to convert a column in H2OFrame to a python list?如何将 H2OFrame 中的列转换为 python 列表?
【发布时间】:2017-08-28 14:20:42
【问题描述】:

我已经阅读了 H2O.ai 的 PythonBooklet.pdf 和 python API documentation,但仍然找不到一个干净的方法来做到这一点。我知道我可以执行以下任一操作:

  • 将 H2OFrame 转换为 Spark DataFrame 并执行 flatMap + collectcollect + 列表解析。
  • 使用H2O的get_frame_data,它给了我一串由\n分隔的标题和数据;然后将其转换为列表(在我的情况下为数字列表)。

有没有更好的方法来做到这一点?谢谢。

【问题讨论】:

    标签: apache-spark spark-dataframe h2o


    【解决方案1】:

    您可以 (1) 将 H2o 帧转换为 pandas 数据帧,(2) 将 pandas 数据帧转换为如下列表:

    pd=h2o.as_list(h2oFrame) 
    l=pd["column"].tolist()
    

    【讨论】:

    • 谢谢它帮助了我,第二行为我做了这件事
    【解决方案2】:

    您可以尝试这样的事情:通过调用 .as_data_frame() 将 H2OFrame 作为 pandas 数据帧引入 python,然后在感兴趣的列上调用 .tolist()。

    一个带有虹膜的独立示例

    import h2o
    h2o.init()
    df = h2o.import_file("iris_wheader.csv")
    pd = df.as_data_frame()
    pd['sepal_len'].tolist()
    

    【讨论】:

    • 谢谢!这肯定是比其他两个更好的解决方案。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-06-24
    • 2016-07-11
    • 1970-01-01
    • 1970-01-01
    • 2018-10-23
    • 1970-01-01
    • 2021-04-12
    相关资源
    最近更新 更多