【发布时间】:2020-12-01 13:19:08
【问题描述】:
我不确定要在我的模型中使用的正确评估指标,希望得到您的建议。
型号信息:
我在一个数据集上用 Python 拟合了一个 GLM Poisson 模型,其中每行数据在 0 到 1 之间具有不同的曝光度,并且响应变量是二进制的。例如,前 4 行数据的曝光和响应在数据框中可能如下所示:
曝光:0.345, 0.123, 0.8, 0.00387....
回复:0, 1, 0, 0.....
我的模型有 6 个因子,均显示出统计学意义。模型预测在0.01到6之间。
我最初使用Mean_Square_Error 和R2_Score 作为评估指标(见下面的代码),但我得到了奇怪的结果。我得到了Mean Square Error: 0.01 和R2_Score: 0.03,这是一个很差的分数。如果我没有将Model_Prediction 乘以Exposure,我得到一个负数R2_Score。
from sklearn.metrics import r2_score
from sklearn.metrics import mean_squared_error
print("Mean Square Error")
print(round(mean_squared_error(Response, Model_Prediction * Exposure),2))
print("R2_Score")
print(round(r2_score(Response, Model_Prediction * Exposure),2))
我的问题是:
- 我是否错误地使用了
mean_squared_error和r2_score? - 鉴于响应为 0/1,我可以在 Poisson 回归问题中使用 ROC 和 AUC 吗?
【问题讨论】:
标签: python glm poisson auc mse