【发布时间】:2017-04-24 15:36:52
【问题描述】:
我在 Linux 服务器上使用 R v3.3.2 和 H2O V3.10.2.1。
我通过h2o.download_mojo 将模型保存到 MOJO。这个生成的文件是一个 .zip 文件。 .zip 文件中有以下文本文件:
model.ini
domains/d000.txt
domains/d001.txt
domains/d002.txt
domains/d003.txt
domains/d004.txt
domains/d005.txt
domains/d006.txt
domains/d007.txt
domains/d008.txt
在model.ini 文件中有一个部分[columns] 列出了用于训练我的模型的列:
[columns]
name
address01
address02
city
state
zip
phone number
age
在model.ini 文件中还有另一个部分[domains] 列出了文件名,其中包含在训练期间用于最终模型中保留的分类列的数据:
[domains]
1: 71 d000.txt
2: 71 d001.txt
3: 51 d002.txt
4: 3243 d003.txt
5: 3228 d004.txt
6: 2954 d005.txt
7: 2456 d006.txt
9: 616 d007.txt
如何将[columns] 中列出的列名与[domains] 中列出的域文件相关联?
例如,第一个域文件 d000.txt 确实不包含列出的第一列 name 的数据。事实上,d000.txt确实包含第 3 列 address02 的数据。
我怎么知道这个映射:
1: 71 d000.txt --> address02
2: 71 d001.txt --> phone number
3: 51 d002.txt --> column 23
4: 3243 d003.txt --> column 58
下载的 POJO(普通的旧 java 对象)包含足够的信息来建立这种关联。我看不到使用下载的 MOJO 的方法。
[domains] 部分中的第四列会有所帮助:
[domains]
1: 71 d000.txt "address02"
2: 71 d001.txt "phone number"
3: 51 d002.txt "column 23"
4: 3243 d003.txt "column 58"
感谢您的帮助!
【问题讨论】: