【问题标题】:How to convert a column in H2OFrame to a python list?如何将 H2OFrame 中的列转换为 python 列表?
【发布时间】:2017-08-28 14:20:42
【问题描述】:
我已经阅读了 H2O.ai 的 PythonBooklet.pdf 和 python API documentation,但仍然找不到一个干净的方法来做到这一点。我知道我可以执行以下任一操作:
- 将 H2OFrame 转换为 Spark DataFrame 并执行
flatMap + collect 或 collect + 列表解析。
- 使用H2O的
get_frame_data,它给了我一串由\n分隔的标题和数据;然后将其转换为列表(在我的情况下为数字列表)。
有没有更好的方法来做到这一点?谢谢。
【问题讨论】:
标签:
apache-spark
spark-dataframe
h2o
【解决方案1】:
您可以 (1) 将 H2o 帧转换为 pandas 数据帧,(2) 将 pandas 数据帧转换为如下列表:
pd=h2o.as_list(h2oFrame)
l=pd["column"].tolist()
【解决方案2】:
您可以尝试这样的事情:通过调用 .as_data_frame() 将 H2OFrame 作为 pandas 数据帧引入 python,然后在感兴趣的列上调用 .tolist()。
一个带有虹膜的独立示例
import h2o
h2o.init()
df = h2o.import_file("iris_wheader.csv")
pd = df.as_data_frame()
pd['sepal_len'].tolist()