【发布时间】:2016-03-17 18:02:09
【问题描述】:
我的问题是我们可以选择在 sklearn 中使用什么决策树算法吗?
在 sklearn 的用户指南中,提到使用了 CART 算法的优化版本。
我们可以换成其他算法,比如 C4.5 吗?
【问题讨论】:
-
这到底是什么意思?目前不处理缺失值和分类变量,也没有后剪枝,只有预剪枝。 C4.5 并不是真正的算法,它是一个程序,对吧?
标签: scikit-learn decision-tree
我的问题是我们可以选择在 sklearn 中使用什么决策树算法吗?
在 sklearn 的用户指南中,提到使用了 CART 算法的优化版本。
我们可以换成其他算法,比如 C4.5 吗?
【问题讨论】:
标签: scikit-learn decision-tree
没有。见documentation
scikit-learn uses an optimised version of the CART algorithm.
【讨论】:
但是有一个参数标准,我们可以选择使用“gini”或“entropy”:
clf = tree.DecisionTreeClassifier(criterion="entropy")
criterion : string, optional (default=”gini”) 要测量的函数 分裂的质量。支持的标准是 Gini 的“gini” 信息增益的杂质和“熵”。
见Docs
【讨论】: