【问题标题】:TransformedValue outputs from PMML - implementation-specific differencesPMML 的 TransformedValue 输出 - 特定于实现的差异
【发布时间】:2015-12-24 19:35:14
【问题描述】:

我的 PMML 模型中有一些派生字段,我想将其公开为输出字段。并且....我可以让它在 Augustus 和 JPMML 中工作(通过 OpenScoring),但我似乎必须做些不同的事情。我想知道是否有人对他们中的哪个正确有任何看法? PMML 规范似乎并没有 100% 明确这一点。

对于 JPMML,我可以通过引用我想要的派生字段来做到这一点,并且我必须避免将它们作为“预测”包含在 MiningSchema 中。

<MiningSchema>
    <MiningField name="foo_input" usageType="active"/>
</MiningSchema>
<Output>
    <OutputField name="foo_output" dataType="integer" feature="transformedValue" optype="continuous">
        <FieldRef field="foo_derived"/>
    </OutputField>
</Output>

但这不适用于奥古斯都。为此,我需要将这些输出声明为 MiningSchema 中的“预测”字段。

<MiningSchema>
    <MiningField name="foo_input" usageType="active"/>
    <MiningField name="foo_output" usageType="predicted"/>
</MiningSchema>
<Output>
    <OutputField name="foo_output" dataType="integer" feature="transformedValue" optype="continuous">
        <FieldRef field="foo_derived"/>
    </OutputField>
</Output>

所以我必须根据我期望的目标评分环境生成不同的 PMML……这听起来不太好。但是哪一个做得对呢?或者有没有其他更便携的表达方式?

在上述所有片段中,foo_derived 只是基于 foo_input 输入值的派生字段。无论是局部转换还是全局转换,似乎都没有任何区别。

<DerivedField name="foo_derived" dataType="integer" optype="continuous">
    <Apply function="+"> <!-- example definition, actual one is a bit more complicated -->
        <FieldRef field="foo_input"/>
        <Constant dataType="integer">1</Constant>
    </Apply>
</DerivedField>

【问题讨论】:

    标签: pmml


    【解决方案1】:

    MiningSchema element 声明必须“导入”哪些字段值才能对模型元素进行评分。此外,如果模型元素表示监督学习模型,它可以声明唯一目标字段的名称:

    target:用作监督模型训练目标的字段。

    Augustus 似乎假设MiningSchema 元素还必须声明哪些字段值是“导出”的。但是,PMML 规范不以任何方式支持此假设。 OutputField 元素是一个独立的实体,它的存在不需要任何其他元素“确认”。

    因此,您在导出模型时应牢记 JPMML。如果您还需要让它们在 Augustus 上可评分,那么您可以考虑使用 JPMML 的访客 API 临时重新排列它们。

    【讨论】:

    • 谢谢。这一切都说得通。无论如何,我在使用 Augustus 时遇到了其他问题,因此 JPMML/OpenScoring 听起来是一个更好的选择(希望 ADAPA 等人的行为会像 JPMML 那样)。诸如递归函数定义、可为空的布尔值等。
    猜你喜欢
    • 2021-10-13
    • 2018-02-04
    • 2020-07-04
    • 2019-06-14
    • 2020-07-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-09
    相关资源
    最近更新 更多