【问题标题】:Weka decision tree prediction NA treatment on missing valuesWeka 决策树预测 NA 对缺失值的处理
【发布时间】:2015-07-03 00:49:42
【问题描述】:

您好,目前我正在实施一个大型 Hellinger 距离决策树,但遇到了一个问题。我在树节点中有一个连续变量,我不知道树将如何预测我是否会有该变量的缺失值。 例如,该节点的拆分标准 =250。树在预测时会选择什么路径? 树训练数据在该变量中也有缺失值。

也许我应该用特定数字替换所有缺失值?

【问题讨论】:

    标签: tree weka decision-tree missing-data


    【解决方案1】:

    您可以根据变量的行为采取行动。还要考虑分类器的值的影响。因此,如果可以概括,您可以使用最小值/最大值/平均值作为缺失值。

    【讨论】:

      【解决方案2】:

      通常坚持输入不包含 Null,然后用户可以在拟合之前找到一种对其进行编码的方法。如果您做出选择,那么您将迫使未来的用户使用您的选择。

      【讨论】:

        猜你喜欢
        • 2015-02-06
        • 2013-12-21
        • 2014-11-23
        • 2016-04-24
        • 2018-03-12
        • 2021-09-12
        • 2017-01-25
        • 2016-07-12
        • 2017-04-11
        相关资源
        最近更新 更多