【问题标题】:Converting h2o model results to a pandas dataframe将 h2o 模型结果转换为 pandas 数据框
【发布时间】:2018-01-21 16:41:03
【问题描述】:

我正在像这样在 h2o 中训练模型:

import h2o

h2o.init()
trainFrame = h2o.import_file(path = "C:/train.csv")

train, test = trainFrame.split_frame([0.8])

x = ["A", "B", "C"]
y = "Target"

m = h2o.estimators.H2ORandomForestEstimator(model_id="RF_defaults")
m.train(x, y, train)

现在我想将这些结果保存到 pandas 数据框。

我正在尝试这样做:

m.as_data_frame(pandas = True)

但返回:

AttributeError: type object 'H2ORandomForestEstimator' has no attribute 'as_data_frame'

【问题讨论】:

  • 嗯,是的。您必须在水框架上调用它,而不是模型。

标签: python python-2.7 pandas h2o


【解决方案1】:

模型对象m里面有很多信息。使用dir(m) 查看所有可用组件。

在某些情况下,m 的组件已经存储为数据框,例如评分历史:

type(m.scoring_history())
# <class 'pandas.core.frame.DataFrame'>

在其他情况下,组件将是一个值列表,例如变量重要性:

type(m.varimp())
# <type 'list'>

所以,看看m的输出,决定你想要什么,用dir(m)中的方法名调用它,然后根据需要转换成数据框。

【讨论】:

    猜你喜欢
    • 2017-11-22
    • 2021-09-18
    • 2018-04-08
    • 2020-11-27
    • 1970-01-01
    • 2015-10-05
    • 1970-01-01
    • 1970-01-01
    • 2019-05-14
    相关资源
    最近更新 更多