【发布时间】:2015-12-11 00:08:57
【问题描述】:
我想使用 spark 构建模型(特别是决策树),然后使用纯 python(不是 pyspark)应用程序应用它们
似乎 PMML 导出是预期的方法,但树模型尚不支持它,而且我没有找到似乎正在积极开发中的 Python 的 PMML 库
【问题讨论】:
标签: python apache-spark decision-tree pmml
我想使用 spark 构建模型(特别是决策树),然后使用纯 python(不是 pyspark)应用程序应用它们
似乎 PMML 导出是预期的方法,但树模型尚不支持它,而且我没有找到似乎正在积极开发中的 Python 的 PMML 库
【问题讨论】:
标签: python apache-spark decision-tree pmml
Augustus 不再处于开发阶段,地址为 https://code.google.com/p/augustus/。最近有工作在https://github.com/alex-pirozhenko/sklearn-pmml 支持 scikitlearn pmml 导入/导出,这可能是一种选择。
如@zero323 所述,PMML 导出仅适用于某些型号。对于其他模型,如果您针对特定的服务平台,您可以编写自己的自定义导出代码或编写自己的解析代码(决策树以自定义拼花格式写出)。
【讨论】: