【发布时间】:2016-10-16 17:57:36
【问题描述】:
我正在按照PMML model export - spark.mllib 的说明创建 K-means 模型。
val numClusters = 10
val numIterations = 10
val clusters = KMeans.train(data, numClusters, numIterations)
// Save and load model: export to PMML
println("PMML Model:\n" + clusters.toPMML("/kmeans.xml"))
但我不知道之后如何加载 PMML。
我在努力
val sameModel = KMeansModel.load(sc, "/kmeans.xml")
并出现:
org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/kmeans.xml/metadata
有什么想法吗?
最好的问候
【问题讨论】:
-
似乎没有任何方法可以导入 PMML 模型。所以,我改变了创建模型的方式,用
KMeansModel.save -
仅以 PMML 格式存储模型重要吗?因为您可以只保存模型然后重新加载它。
-
我建议你看看这个项目,它为 Spark 添加了更多功能齐全的 PMML 功能:github.com/jpmml/jpmml-spark。
标签: scala apache-spark apache-spark-mllib pmml