【问题标题】:How is it possible to run a spark mlib decision tree model in pure python?如何在纯 python 中运行 spark mllib 决策树模型?
【发布时间】:2015-12-11 00:08:57
【问题描述】:

我想使用 spark 构建模型(特别是决策树),然后使用纯 python(不是 pyspark)应用程序应用它们

似乎 PMML 导出是预期的方法,但树模型尚不支持它,而且我没有找到似乎正在积极开发中的 Python 的 PMML 库

【问题讨论】:

    标签: python apache-spark decision-tree pmml


    【解决方案1】:

    Augustus 不再处于开发阶段,地址为 https://code.google.com/p/augustus/。最近有工作在https://github.com/alex-pirozhenko/sklearn-pmml 支持 scikitlearn pmml 导入/导出,这可能是一种选择。

    如@zero323 所述,PMML 导出仅适用于某些型号。对于其他模型,如果您针对特定的服务平台,您可以编写自己的自定义导出代码或编写自己的解析代码(决策树以自定义拼花格式写出)。

    【讨论】:

    • DecisionTreeModel 没有 PMML 编写器,所以在这里不起作用。
    • 啊,是的,这是一个很好的观点(这只是回答了关于在 Python 中何处获得 PMML 支持的问题的一部分)。
    • 是的,因为决策树相对简单,这样的东西就足够了:stackoverflow.com/a/31975050/1560062
    • 目前,alex-pirozhenko/sklearn-pmml 仅将 Python 模型导出到 PMML(反之亦然)。因此,如果您仍然缺少 Python 的 PMML 使用者,这可能不是很有帮助。
    • 啊,很好,所以真的只留下奥古斯都,就发展而言,它并不是那么活跃。
    猜你喜欢
    • 2016-11-15
    • 1970-01-01
    • 2016-09-11
    • 2015-10-25
    • 2016-10-07
    • 2023-03-12
    • 2016-07-08
    • 2019-04-03
    • 2015-02-02
    相关资源
    最近更新 更多