【发布时间】:2018-02-13 06:11:02
【问题描述】:
我已经训练并测试了一个机器学习模型(GBTClassificationModel 或 RandomForestClassificationModel)。然后我想保存训练好的模型以备将来使用。所以我做了以下事情:
model.save("...");
以 GBTClassificationModel 为例,保存后。保存的文件是一个包含“数据、元数据和treesMetadata”的目录。我的问题是如何使用这个保存的模型以备将来使用?例如,我想做如下的事情:
model = spark.load("...");
Dataset<Row> predict_data= model_model.transform(dataset_test1)
有什么建议吗?谢谢。
更新:
事实证明非常简单:
GBTClassificationModel model1 = GBTClassificationModel.load("...");
Dataset<Row> predict_data= model1.transform(dataset_test)
【问题讨论】:
标签: java apache-spark apache-spark-mllib