【问题标题】:Interpret R output Rpart classification tree surrogate splits解释 R 输出 Rpart 分类树代理拆分
【发布时间】:2013-04-09 10:58:07
【问题描述】:
Surrogate splits:
    ##       bmi    < 21.51 to the right, agree=0.858, adj=0.632, (0 split)

我知道,这种拆分基于 bmi 值

我不明白输出的 (0 split) 部分? 另外,如果协议的值为 1,这是否值得怀疑?

谢谢!

【问题讨论】:

    标签: r machine-learning classification decision-tree rpart


    【解决方案1】:

    如果您在第一次主要拆分中缺少例如 10 个,则 rpart 将尝试使用代理拆分对它们进行分类。 如果其中 9 个在您的第一个代理变量中未丢失,则 rpart 将使用此变量,并且您将在此代理变量旁边的 rpart 输出中具有 (9 split),因为该变量用于 9 次拆分.

    如果您的代理变量也缺少数据,那么您的输出中将有 (0 splits)

    我不知道 agreement 的确切计算,但如果您有 1 的一致,那么我猜代理变量的结果与使用时的分类相同主要变量。 例如,如果您的代理变量是主变量的单调变换版本,则可能会发生这种情况。

    【讨论】:

      猜你喜欢
      • 2011-02-05
      • 2015-09-18
      • 2015-02-17
      • 2021-05-30
      • 2018-02-25
      • 2014-04-08
      • 1970-01-01
      • 2021-05-17
      • 2015-07-14
      相关资源
      最近更新 更多