【问题标题】:Python scikit-learn: How do I convert decision tree leaves to dummy variables?Python scikit-learn:如何将决策树叶转换为虚拟变量?
【发布时间】:2018-12-01 02:28:33
【问题描述】:

我正在使用 scikit-learn DecisionTreeClassifier 来构建决策树。假设给定的决策树有 6 个叶/终端节点(A、B、C、D、E 和 F)。我现在想分配编码为它们将属于哪个叶/终端节点的原始记录(将其视为特征工程的一种形式)。

我不希望直接对记录进行评分,而是将来自各种树的虚拟变量集合构建到特征工程管道中。

有没有人知道这样做的简单方法?

【问题讨论】:

标签: python scikit-learn decision-tree dummy-variable


【解决方案1】:

ensemble.RandomTreesEmbedding 下实现了类似的东西。请注意,n_estimators 表示决策树的数量。

请参阅文档here

【讨论】:

  • 非常感谢,我会调查的。
猜你喜欢
  • 1970-01-01
  • 2017-12-30
  • 2017-02-23
  • 2020-04-05
  • 2023-04-07
  • 2014-06-26
  • 2017-03-26
  • 2021-03-07
相关资源
最近更新 更多