【问题标题】:glm.fit: algorithm did not converge errorglm.fit:算法没有收敛错误
【发布时间】:2020-04-05 18:44:32
【问题描述】:

我在下面尝试使用 glm 时遇到错误并且无法修复?我该如何解决这个问题?

setwd("C:/Users/ali.erkun/Desktop/524")
data<-read_excel("Take Home Dataset.xls")
attach(data)

L12M_LOAN_ACCEPT_2<-as.numeric(L12M_LOAN_ACCEPT)
#Zorlamadan dolayı ortaya çıkan NAs - we must omitt NAs
L12M_omitted<-na.omit(L12M_LOAN_ACCEPT_2)

summary(L12M_omitted)

data$L12M_LOAN_ACCEPT <-as.numeric(factor(ifelse(data$L12M_LOAN_ACCEPT == ".", 0,data$L12M_LOAN_ACCEPT)))

str(data)

fit <- glm(LABEL ~ ., family = binomial(link = "logit"), data = data, )

loanlogit_full

【问题讨论】:

  • 您可以在这里看到类似的问题及其答案:stats.stackexchange.com/questions/5354/…
  • 我怀疑存在一个离散变量(可能是高收入,女性,之前获得过贷款?),所有贷款申请都被接受。因此,如果对于每个已经成功申请的客户,下一次接受新贷款的概率为 1,则无需进行估计。如果来自工作类别 A 的客户的贷款申请被系统地拒绝,也会出现同样的想法。在这里,您需要更好地了解您的数据和模型。

标签: r statistics glm


【解决方案1】:

您很可能可以将您的响应与一个或多个预测变量完美分离。请参阅this answer 和@John.G 链接的那个。如果您的一个自变量完美地预测了结果,则该预测变量的系数将无限增长(因此不会收敛)。

有很多方法可以解决这个问题 - https://stats.stackexchange.com/a/68917/275337 很好地概述了这些选项。

【讨论】:

    猜你喜欢
    • 2020-03-08
    • 2018-11-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-08-12
    • 1970-01-01
    • 2021-12-26
    • 1970-01-01
    相关资源
    最近更新 更多