【问题标题】:How to choose the root node in Rpart package in RR中如何选择Rpart包中的根节点
【发布时间】:2021-11-20 21:14:20
【问题描述】:

我正在一个项目中工作,该项目需要在 R 中使用 Rpart 包来构建决策树。

但是,我的直接下属经理对作为树中根节点的特定变量感兴趣,因为他认为该特定变量对我们的业务很重要。

我是否知道有人知道如何强制树以该特定变量开始?例如,该变量名是 X。

数据集描述:目标变量 Y. 与其他 30 个自变量。

代码:

tree <- rpart(Y~., method="class", data=train, parms=list(split="information"), control=rpart.control(cp=.0002,minsplit = 5,minbucket = 5,maxdepth = 10))

【问题讨论】:

  • 你需要什么?拆分规则是否足够?你需要一张树的照片吗?您需要能够交叉验证还是训练错误足够好?
  • 您好,每个参数都足够好。我能够构建树并能够生成情节。但是,我想强制它以 X 开头的树的第一个根节点。请问您是否知道如何在代码中执行此操作?谢谢

标签: r decision-tree rpart


【解决方案1】:

这是不可能的,因为它违背了所用算法的逻辑。你有两个选择:

  • 通过使用预先过滤的数据创建 2 个决策树模型来手动进行拆分。
  • 使用允许这样做的不同决策树模型,例如 lightgbm(请注意算法不同)。

【讨论】:

  • 感谢您的建议。我是 R 编码的新手,因此就您的第一个建议而言:“通过使用预先过滤的数据创建 2 个决策树模型来手动进行拆分”。我如何在编码中实现这一点?例如:X 中有 3 个级别。第一步是它:tree
  • 或者如你所说。如果我想使用 lightgbm 方法,我已经阅读了这个包,但仍然无法在包中找到可以强制它的参数。任何链接或示例代码将不胜感激。非常感谢
猜你喜欢
  • 2016-06-10
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-08-09
  • 1970-01-01
  • 1970-01-01
  • 2012-08-21
相关资源
最近更新 更多