【问题标题】:Is there a way to give a reason with every prediction in a machine learning model有没有办法为机器学习模型中的每个预测给出一个理由
【发布时间】:2026-01-16 22:40:02
【问题描述】:

我正在开展一个项目,我需要为从我的机器学习模型中获得预测的每个数据行提供一个原因。我正在使用逻辑回归模型(二元分类)来获得我的预测,并且截止阈值为 0.6。我曾尝试使用 SHAP 和 ELI5 来识别最重要的特征,但这适用于所有数据点。我想说明每个数据点为何被归类为 1 的原因。我不确定如何使其在本地可解释以供人类理解预测。

【问题讨论】:

    标签: python machine-learning logistic-regression shap


    【解决方案1】:

    我认为它可以通过一些假设:

    1. we use LR instead of NN
    2. each variable "X" treated as binary variable
    

    对于 LR 方程:

    y = 1/1+exp(-wi*xi)
    

    由于 xi 属于 {0, 1},我们可以将 w_i 视为特征重要性。

    对于你提到的每个实例,我们可以通过 w_i 对 x_i 进行排序,并找出该实例中的 x_i 是 0 还是 1。然后应该使用前 10 个(可能是 50 个)x_i 来解释。

    【讨论】:

    • 我想让它更易于人类解释,比如 SHAP 如何告诉您在全局数据集上进行预测时哪些特征更重要。我希望每个本地点都有类似的东西。
    • @ajeevanshgautam 如果您想要与其他类似的东西,请进行研究(How to ask 中的第一个命令)并通过提供具体示例在此处分享;在任何情况下,你的问题都是一个很好的例子,说明为什么这些模糊、笼统和没有充分说明的问题不适合 SO。
    最近更新 更多