【发布时间】:2014-04-26 14:08:44
【问题描述】:
在 Python 包statsmodels 中,LogitResults.pred_table 可以方便地用于获取“混淆矩阵”,对于任意阈值t,对于表单的Logit 模型
mod_fit = sm.Logit.from_formula('Y ~ a + b + c', train).fit()
...
mod_fit.pred_table(t)
#Conceptually: pred_table(t, predicted=mod_fit.predict(train), observed=train.Y)
有没有办法获取测试数据的等效信息?例如,如果我
pred = mod_fit.predict(test)
我如何获得等价物
mod_fit.pred_table(t, predicted=pred, observed=test.Y)
有没有办法让statsmodels 做到这一点(例如,一种从pred 和train.Y 构建LogitResults 实例的方法),还是需要“手动”完成 - 和如果是的话怎么办>
【问题讨论】:
-
不是直接答案:这显示了 ROC 曲线的类似计算(基于交叉验证)nbviewer.ipython.org/urls/umich.box.com/shared/static/…
标签: python regression statsmodels confusion-matrix