【问题标题】:Can we choose what Decision Tree algorithm to use in sklearn?我们可以选择在 sklearn 中使用什么决策树算法吗?
【发布时间】:2016-03-17 18:02:09
【问题描述】:

我的问题是我们可以选择在 sklearn 中使用什么决策树算法吗?

在 sklearn 的用户指南中,提到使用了 CART 算法的优化版本。

我们可以换成其他算法,比如 C4.5 吗?

【问题讨论】:

  • 这到底是什么意思?目前不处理缺失值和分类变量,也没有后剪枝,只有预剪枝。 C4.5 并不是真正的算法,它是一个程序,对吧?

标签: scikit-learn decision-tree


【解决方案1】:

没有。见documentation

scikit-learn uses an optimised version of the CART algorithm.

【讨论】:

    【解决方案2】:

    但是有一个参数标准,我们可以选择使用“gini”或“entropy”:

    clf = tree.DecisionTreeClassifier(criterion="entropy")
    

    criterion : string, optional (default=”gini”) 要测量的函数 分裂的质量。支持的标准是 Gini 的“gini” 信息增益的杂质和“熵”。

    Docs

    【讨论】:

      猜你喜欢
      • 2016-02-23
      • 2018-07-07
      • 2018-08-14
      • 2020-01-09
      • 2017-10-11
      • 1970-01-01
      • 2019-08-12
      • 1970-01-01
      • 2018-08-26
      相关资源
      最近更新 更多