【问题标题】:Multiple logistic regression comparing multiple categorical predictors and multiple binary outcomes比较多个分类预测变量和多个二元结果的多元逻辑回归
【发布时间】:2019-04-08 14:12:49
【问题描述】:

假设我有一个数据框data

Name      V1      V2      V3
Name 1    0       1       1
Name 1    0       0       1
Name 1    1       1       1
Name 2    1       0       0
Name 2    0       0       1
Name 2    1       1       0
Name 3    1       0       0
Name 3    1       0       1
Name 3    1       1       0

因子Name 1Name 2Name 3 是分类变量,用于预测V1:V3 中列出的二元结果。

我想执行 ANOVA 或多元逻辑回归,根据 V1:V3 中显示的二元结果分布比较 data$name 中的每个因素,但我不确定如何去做/如何去做更改我的数据框以适当地执行分析。已经在data$Name 的各个因素上尝试了Anova()glm(family=binomial(link="logit"),但这并不能完全产生我正在寻找的比较。我想要执行的分析类型会告诉我,与Name 2 和/或Name 3 相比,Name 1 是否更有可能对V1:V3 的一个或所有响应变量产生特定结果。

任何帮助将不胜感激!

【问题讨论】:

    标签: r regression logistic-regression binary-data categorical-data


    【解决方案1】:

    在这种情况下,ANOVA 听起来不合适,但逻辑回归应该没问题。您可以对每个的结果变量进行逻辑回归:

    data$Name <- as.factor(data$Name)
    yourmodel <- glm(V1 ~ Name, data=data, family=binomial(link="logit"))
    

    或其他选项(如 cmets 中所建议的):

    yourmodel <- glm(Name ~V1 + V2 +V3, data=data, family=binomial(link="logit"))
    

    ...在每种情况下,您都可以通过以下方式获得模型残差、系数等:

    summary(yourmodel)
    

    ...您可以从中提取优势比。

    【讨论】:

    • 我认为问题的发布者正在寻找:yourmodel &lt;- glm(Name ~ V1 + V2 +V3, data=data, family=binomial(link="logit"))。但他的问题有点不清楚。
    • 谢谢,我已将其添加到答案中。
    • 谢谢。如果 data$Name 中的一个因素仅包含给定结果变量的 0,我注意到 data$Name 变量未显示在 summary(glmmodel) 输出中。有没有办法在输出中包含这些变量?
    • @soosus:理论上所有的 0 都会导致计算出现问题。你试过单独喂给glm吗?
    • 实际上,我现在意识到,无论 0 是否为我正在运行的任何 glm() 调用,都没有报告其中一个因素。该因素仍在使用的数据框中。关于为什么会这样的任何想法?
    猜你喜欢
    • 2022-08-24
    • 1970-01-01
    • 2021-02-26
    • 2021-01-21
    • 2020-08-01
    • 1970-01-01
    • 1970-01-01
    • 2020-08-19
    • 2019-07-22
    相关资源
    最近更新 更多