【发布时间】:2017-10-15 08:37:51
【问题描述】:
我收到了一个包含朴素贝叶斯分类器模型的 PMML 文件。
是否可以将 PMML 文件导入 MLlib 并使用 Python 编程语言重建模型?
【问题讨论】:
标签: python apache-spark-mllib pmml
我收到了一个包含朴素贝叶斯分类器模型的 PMML 文件。
是否可以将 PMML 文件导入 MLlib 并使用 Python 编程语言重建模型?
【问题讨论】:
标签: python apache-spark-mllib pmml
是否可以将 PMML 文件导入 MLlib ..
不,这是不可能的,因为 PMML 和 MLlib 模型表示彼此不兼容。
如果您有一个 PMML 模型,那么您应该在 Apache Spark 上使用专用 PMML 评分库(例如 JPMML-Spark)来执行它。
.. 并使用 Python 编程语言重构模型?
您的意思是使用 PySpark 访问 PMML 评分功能吗?您可以使用 PySpark 执行 JPMML-Spark 函数,无需为此在 Python 中重建模型对象。
【讨论】:
您可以使用PyPMML-Spark 在 PySpark 中导入 PMML,例如:
from pypmml_spark import ScoreModel
model = ScoreModel.fromFile('the/pmml/model/path')
score_df = model.transform(df)
【讨论】: