【问题标题】:Classification table for logistic regression in RR中逻辑回归的分类表
【发布时间】:2012-11-19 14:33:55
【问题描述】:

我有一个数据集,其中包含一个存储在 csv 文件中的二分因变量 (Y) 和 12 个自变量(X1X12)。以下是前 5 行数据:

Y,X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,X11,X12  
0,9,3.86,111,126,14,13,1,7,7,0,M,46-50  
1,7074,3.88,232,4654,143,349,2,27,18,6,M,25-30  
1,5120,27.45,97,2924,298,324,3,56,21,0,M,31-35
1,18656,79.32,408,1648,303,8730,286,294,62,28,M,25-30
0,3869,21.23,260,2164,550,320,3,42,203,3,F,18-24

我使用以下代码从数据中构建了一个逻辑回归模型:

mydata <- read.csv("data.csv")     
mylogit <- glm(Y~X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12, data=mydata, 
               family="binomial")  
mysteps <- step(mylogit, Y~X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12, data=mydata, 
                family="binomial")

我可以使用代码获得每个数据的预测概率:

theProbs <- fitted(mysteps)

现在,我想创建一个分类表——使用数据表的前 20 行 (mydata)——从中我可以确定实际与数据一致的预测概率的百分比。请注意,对于因变量(Y),0 表示小于 0.5 的概率,1 表示大于 0.5 的概率。

我花了很多时间尝试构建分类,但没有成功。如果有人建议可以帮助解决此问题的代码,我将不胜感激。

【问题讨论】:

  • table(theProbs&gt;.5, mydata$Y) 怎么样(很容易对前 20 个观察值进行子集化)?
  • 感谢百万智。我认为这正是我所需要的。再次感谢和最好的问候。

标签: r cross-validation


【解决方案1】:

问题有点老了,但我想如果有人正在查看档案,这可能会有所帮助。 这很容易通过 xtabs 完成

classDF <- data.frame(response = mydata$Y, predicted = round(fitted(mysteps),0))

xtabs(~ predicted + response, data = classDF)

这将产生一个像这样的表格:

           response
predicted   0   1
        0 339 126
        1 130 394

【讨论】:

    【解决方案2】:

    我认为“圆形”可以在这里完成这项工作。
    表(圆形(theProbs))

    【讨论】:

      猜你喜欢
      • 2018-01-26
      • 2016-12-11
      • 1970-01-01
      • 2013-12-12
      • 2018-02-12
      • 2014-06-20
      • 2021-11-13
      • 1970-01-01
      • 2014-06-26
      相关资源
      最近更新 更多