【问题标题】:How to see the column that influences the prediction result the most?如何查看对预测结果影响最大的列?
【发布时间】:2017-09-10 01:53:27
【问题描述】:

我正在使用 Azure 机器学习工作室来预测使用二级提升决策树和拆分数据的列。

我组装的图表可以在这里找到:

我需要的是,我希望看到数据集中对预测影响最大的列。换句话说,改变预测结果的列比数据集中的其他列更多。

抱歉,之前有人问过这个问题,但我找不到这个简单问题的正确答案。

【问题讨论】:

    标签: azure machine-learning azure-machine-learning-studio


    【解决方案1】:

    如前所述,排列特征重要性可以解决问题。附加 Permutation Feature Importance 块做 train 块,单击输出端口,然后选择可视化以获取模块的结果。上图显示了按排列重要性分数降序排列的特征列表。

    建议:当您具有高度相关的特征时,在解释排列分数的结果时要小心。

    有关详细信息,请参阅: https://standupdata.com/category/permutation-feature-importance/https://gallery.cortanaintelligence.com/Experiment/Permutation-Feature-Importance-5

    【讨论】:

      【解决方案2】:

      大多数决策树的 ML 实现在其模型中都包含“特征重要性”。例如,Scikit Learn Decision Tree Classifier 有一个属性表示每个特征的重要性。

      Azure ML 实现也不例外。请看下面的链接Permutation Feature Importance

      【讨论】:

        猜你喜欢
        • 2021-10-15
        • 2015-01-14
        • 1970-01-01
        • 1970-01-01
        • 2016-03-11
        • 1970-01-01
        • 1970-01-01
        • 2023-03-29
        • 2019-08-20
        相关资源
        最近更新 更多