【问题标题】:H2O MOJO (Model ObJect, Optimized): Associating [columns] with [domains]H2O MOJO(模型对象,优化):将 [列] 与 [域] 关联
【发布时间】:2017-04-24 15:36:52
【问题描述】:

我在 Linux 服务器上使用 R v3.3.2 和 H2O V3.10.2.1。

我通过h2o.download_mojo 将模型保存到 MOJO。这个生成的文件是一个 .zip 文件。 .zip 文件中有以下文本文件:

model.ini
domains/d000.txt
domains/d001.txt
domains/d002.txt
domains/d003.txt
domains/d004.txt
domains/d005.txt
domains/d006.txt
domains/d007.txt
domains/d008.txt

model.ini 文件中有一个部分[columns] 列出了用于训练我的模型的列:

[columns]
name
address01
address02
city
state
zip
phone number
age

model.ini 文件中还有另一个部分[domains] 列出了文件名,其中包含在训练期间用于最终模型中保留的分类列的数据:

[domains]
1: 71 d000.txt
2: 71 d001.txt
3: 51 d002.txt
4: 3243 d003.txt
5: 3228 d004.txt
6: 2954 d005.txt
7: 2456 d006.txt
9: 616 d007.txt

如何将[columns] 中列出的列名与[domains] 中列出的域文件相关联?

例如,第一个域文件 d000.txt 确实包含列出的第一列 name 的数据。事实上,d000.txt确实包含第 3 列 address02 的数据。

我怎么知道这个映射:

1: 71 d000.txt    -->  address02
2: 71 d001.txt    -->  phone number
3: 51 d002.txt    -->  column 23
4: 3243 d003.txt  -->  column 58

下载的 POJO(普通的旧 java 对象)包含足够的信息来建立这种关联。我看不到使用下载的 MOJO 的方法。

[domains] 部分中的第四列会有所帮助:

[domains]
1: 71 d000.txt "address02"
2: 71 d001.txt "phone number"
3: 51 d002.txt "column 23"
4: 3243 d003.txt "column 58"

感谢您的帮助!

【问题讨论】:

    标签: r h2o


    【解决方案1】:

    [域] 对它们所属的列有一个从 0 开始的索引。在下面的示例中,“7:”指的是 CAPSULE 列:它在 d000.txt 文件中列出了一个 2 因子域。

    [columns]
    AGE
    RACE
    DPROS
    DCAPS
    PSA
    VOL
    GLEASON
    CAPSULE
    
    [domains]
    7: 2 d000.txt
    

    【讨论】:

    • 谢谢!我的错误是没有意识到编号是从 0 开始的。
    猜你喜欢
    • 1970-01-01
    • 2020-10-27
    • 2020-01-04
    • 2016-04-05
    • 1970-01-01
    • 1970-01-01
    • 2021-06-08
    • 2020-11-20
    • 1970-01-01
    相关资源
    最近更新 更多