【问题标题】:floating numbers of value attributes in decision tree nodes (scikit-learn, randomforest)决策树节点中的值属性的浮点数(scikit-learn,randomforest)
【发布时间】:2020-08-29 02:32:41
【问题描述】:

我试图从 scikit-learn 生成的拟合随机森林中绘制一棵树。在树状图中,每个节点都包含一些元素,包括一个值列表。我认为通常值列表表示该节点中每个类的样本数。但是我得到的情节,值是浮点数。我很困惑,怎么可能有 100.447 个样本。

我用来绘制树的代码是:

export_graphviz(estimator, out_file='tree_test6.dot', feature_names = df_feature.columns,
                class_names = unique_labels(sample['Activity']), rounded = True, proportion = False, precision = 2, filled = True)

我将一个参数precision = 2 更改为precision = 0 浮点数为零后的数字与基尼和阈值相同,但这并不能解决问题。我真的很想知道如何解释这个浮动数量的价值属性。

链接是我在树中得到的两个节点的图。

a zoom two nodes of the tree

【问题讨论】:

    标签: python scikit-learn treeview decision-tree treenode


    【解决方案1】:

    刚刚为自己解决了这个问题。回到你的分类器,看看你是否有效地让它对某些类进行多次采样。对我来说,我遇到了这个“问题”,因为我使用了 class_weight='balanced' 然后在我期望整数的地方得到了浮点数。

    这里早就解释过了:https://github.com/scikit-learn/scikit-learn/issues/2703

    【讨论】:

      猜你喜欢
      • 2017-03-26
      • 2017-01-21
      • 2019-12-11
      • 2015-08-05
      • 1970-01-01
      • 2017-02-23
      • 2020-04-05
      • 2016-08-12
      相关资源
      最近更新 更多