【问题标题】:Spark ml and PMML exportSpark ml 和 PMML 导出
【发布时间】:2016-08-09 21:40:28
【问题描述】:
我知道可以将模型导出为PMML 和Spark-MLlib,但是Spark-ML 呢?
是否可以将 LinearRegressionModel 从 org.apache.spark.ml.regression 转换为 LinearRegressionModel 从 org.apache.spark.mllib.regression 以便能够调用 toPMML() 方法?
【问题讨论】:
标签:
java
apache-spark
linear-regression
pmml
【解决方案1】:
您可以使用 JPMML-SparkML 库将 Spark ML 管道转换为 PMML:
StructType schema = dataFrame.schema()
PipelineModel pipelineModel = pipeline.fit(dataFrame);
org.dmg.pmml.PMML pmml = org.jpmml.sparkml.ConverterUtil.toPMML(schema, pipelineModel);
JAXBUtil.marshalPMML(pmml, new StreamResult(System.out));