决策树节点中的值属性的浮点数（scikit-learn，randomforest）答案

【问题标题】：floating numbers of value attributes in decision tree nodes (scikit-learn, randomforest)决策树节点中的值属性的浮点数（scikit-learn，randomforest）
【发布时间】：2020-08-29 02:32:41
【问题描述】：

我试图从 scikit-learn 生成的拟合随机森林中绘制一棵树。在树状图中，每个节点都包含一些元素，包括一个值列表。我认为通常值列表表示该节点中每个类的样本数。但是我得到的情节，值是浮点数。我很困惑，怎么可能有 100.447 个样本。

我用来绘制树的代码是：

export_graphviz(estimator, out_file='tree_test6.dot', feature_names = df_feature.columns,
                class_names = unique_labels(sample['Activity']), rounded = True, proportion = False, precision = 2, filled = True)

我将一个参数precision = 2 更改为precision = 0 浮点数为零后的数字与基尼和阈值相同，但这并不能解决问题。我真的很想知道如何解释这个浮动数量的价值属性。

链接是我在树中得到的两个节点的图。

a zoom two nodes of the tree

【问题讨论】：

标签： python scikit-learn treeview decision-tree treenode

【解决方案1】：

刚刚为自己解决了这个问题。回到你的分类器，看看你是否有效地让它对某些类进行多次采样。对我来说，我遇到了这个“问题”，因为我使用了 class_weight='balanced' 然后在我期望整数的地方得到了浮点数。

这里早就解释过了：https://github.com/scikit-learn/scikit-learn/issues/2703

【讨论】：