【发布时间】:2017-09-10 01:53:27
【问题描述】:
我正在使用 Azure 机器学习工作室来预测使用二级提升决策树和拆分数据的列。
我组装的图表可以在这里找到:
我需要的是,我希望看到数据集中对预测影响最大的列。换句话说,改变预测结果的列比数据集中的其他列更多。
抱歉,之前有人问过这个问题,但我找不到这个简单问题的正确答案。
【问题讨论】:
标签: azure machine-learning azure-machine-learning-studio
我正在使用 Azure 机器学习工作室来预测使用二级提升决策树和拆分数据的列。
我组装的图表可以在这里找到:
我需要的是,我希望看到数据集中对预测影响最大的列。换句话说,改变预测结果的列比数据集中的其他列更多。
抱歉,之前有人问过这个问题,但我找不到这个简单问题的正确答案。
【问题讨论】:
标签: azure machine-learning azure-machine-learning-studio
如前所述,排列特征重要性可以解决问题。附加 Permutation Feature Importance 块做 train 块,单击输出端口,然后选择可视化以获取模块的结果。上图显示了按排列重要性分数降序排列的特征列表。
建议:当您具有高度相关的特征时,在解释排列分数的结果时要小心。
有关详细信息,请参阅: https://standupdata.com/category/permutation-feature-importance/https://gallery.cortanaintelligence.com/Experiment/Permutation-Feature-Importance-5
【讨论】:
大多数决策树的 ML 实现在其模型中都包含“特征重要性”。例如,Scikit Learn Decision Tree Classifier 有一个属性表示每个特征的重要性。
Azure ML 实现也不例外。请看下面的链接Permutation Feature Importance。
【讨论】: