glm.fit：算法没有收敛错误答案

【问题标题】：glm.fit: algorithm did not converge errorglm.fit：算法没有收敛错误
【发布时间】：2020-04-05 18:44:32
【问题描述】：

我在下面尝试使用 glm 时遇到错误并且无法修复？我该如何解决这个问题？

setwd("C:/Users/ali.erkun/Desktop/524")
data<-read_excel("Take Home Dataset.xls")
attach(data)

L12M_LOAN_ACCEPT_2<-as.numeric(L12M_LOAN_ACCEPT)
#Zorlamadan dolayı ortaya çıkan NAs - we must omitt NAs
L12M_omitted<-na.omit(L12M_LOAN_ACCEPT_2)

summary(L12M_omitted)

data$L12M_LOAN_ACCEPT <-as.numeric(factor(ifelse(data$L12M_LOAN_ACCEPT == ".", 0,data$L12M_LOAN_ACCEPT)))

str(data)

fit <- glm(LABEL ~ ., family = binomial(link = "logit"), data = data, )

loanlogit_full

【问题讨论】：

您可以在这里看到类似的问题及其答案：stats.stackexchange.com/questions/5354/…
我怀疑存在一个离散变量（可能是高收入，女性，之前获得过贷款？），所有贷款申请都被接受。因此，如果对于每个已经成功申请的客户，下一次接受新贷款的概率为 1，则无需进行估计。如果来自工作类别 A 的客户的贷款申请被系统地拒绝，也会出现同样的想法。在这里，您需要更好地了解您的数据和模型。

标签： r statistics glm

【解决方案1】：

您很可能可以将您的响应与一个或多个预测变量完美分离。请参阅this answer 和@John.G 链接的那个。如果您的一个自变量完美地预测了结果，则该预测变量的系数将无限增长（因此不会收敛）。

有很多方法可以解决这个问题 - https://stats.stackexchange.com/a/68917/275337 很好地概述了这些选项。

【讨论】：