【问题标题】:Rpart - Variable Importance Vector - how?Rpart - 变量重要性向量 - 如何?
【发布时间】:2015-12-23 00:08:31
【问题描述】:

我已经在互联网上搜索了一段时间,以了解 rpart 分配给变量重要性输出上的变量的数字“排名”统计信息。

我知道这个数字加到 100,但它到底是什么,它叫什么,它代表什么?

我发现它在过去将许多分类列排序到连续目标变量非常有用

【问题讨论】:

    标签: variables rpart


    【解决方案1】:

    它是为每个变量单独计算的,该值是作为杂质减少的总和计算的,当变量作为主要分裂出现时和作为替代出现时都计算在内。然后将其转换为百分比评分,最高值为 100 并连续成比例直到较低的值。 您可以在此处阅读有关变量重要性含义的更好描述: https://cran.r-project.org/web/packages/rpart/vignettes/longintro.pdf 和 Breiman 的书(分类和回归树)。

    希望这会有所帮助!

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-08-04
      • 2019-10-11
      • 1970-01-01
      • 2020-03-31
      • 2015-07-25
      • 2016-05-29
      • 2016-07-05
      • 2016-09-29
      相关资源
      最近更新 更多