【问题标题】:Compare slopes of regression lines by interaction of covariates通过协变量的交互作用比较回归线的斜率
【发布时间】:2018-11-05 00:56:43
【问题描述】:

我发现了许多关于该主题的问题,但没有一个与我的场景非常相似。这主要是一个一般的统计方法问题,但非常感谢任何有关如何在 R 中处理此类数据的有用信息!

这是一项生物学研究,我使用三个独立的突变“A、B 和 C”来创建基因型。对于我的研究设计,我有一个因变量(距离)和一个自变量(负载)。我在以下基因型中测量:

Genotypes:

Reference
A
B
C
A:B
A:C
B:C
A:B:C

即我的参考基因型中有距离给定负载的背景水平。我要测试的是每个单独的突变(A、B 或 C)和组合突变(AB、AC、BC、ABC)对给定负载的距离的贡献。我的计划是测试不同基因型产生的回归斜率是否彼此显着不同。这将使我能够确定距离的损失是否是由于负载的附加增加,或者某些基因型在负载增加的情况下更快或更慢地失去距离。

我不确定是否/如何使用 ANCOVA 或混合效应模型来解决这个问题。

我有一个类似的方法,我可以看到距离如何随基因型而变化。在该示例中,我的数据结构如下所示(csv):

Genotype, Distance, A, B, C
Reference, 15, 0, 0, 0
Reference, 16, 0, 0, 0
A, 15, 1, 0, 0
A, 16, 1, 0, 0
B, 12, 0, 1, 0
B, 11, 0, 1, 0
C, 15, 0, 0, 1
C, 15, 0, 0, 1
AB, 3, 1, 1, 0
AB, 4, 1, 1, 0
AC, 13, 1, 0, 1
AC, 14, 1, 0, 1
BC, 8, 0, 1, 1
BC, 9, 0, 1, 1
ABC, 2, 1, 1, 1
ABC, 2, 1, 1, 1

我测量每个基因型的距离(带有重复),并使用数据矩阵来指示该基因型具有哪些突变: 所以A有1,0,0表示它有A,但没有B,也没有C; AB 有 1、1、0 表示它有 A 和 B,但没有 C。等等...

然后我使用:

 lm<-lm(Distance~A*B*C, data=data)
summary(lm)

测试每个突变对距离的贡献,并查看是否有任何交互项(例如 A:B)显着。这使用 A、B 和 C 作为连续变量(违反正态性,但至少是一种方法)。

非常感谢任何人可以为我提供的任何帮助、见解或方向。应用这种 lm() 方法适用于一个因变量和基因型作为自变量,但使用基因型(包括交互作用)作为第二个自变量的协变量是我在其他问题中没有看到的。

【问题讨论】:

    标签: r regression lm anova mixed-models


    【解决方案1】:

    使用固定效应模型:

    fit.null &lt;- lm(Distance ~ A*B*C + Genotype)

    fit.alt&lt;- lm(Distance ~ A*B*C * Genotype)

    并使用aov(fit.alt, fit.null) 测试嵌套模型。

    假设:足够的功率和同方差性:一个简单的技巧,交叉表 freqs &lt;- table(A, B, C, Genotype) 并检查 any(freqs) &lt; 5。低精度意味着低功耗。

    使用lme4(也许用户@BenBolker 可以评论此模型的适用性)使用方差齐性检验的混合效应模拟:

    fit.null &lt;- lmer(Distance ~ A*B*C + (1|Genotype))

    fit.alt &lt;- lmer(Distance ~ A*B*C + (A*B*C|Genotype))

    您无法在此处测试嵌套模型,因为它是对方差分量的测试。像这样的测试模型更多的是 stats.stackexchange.com 的问题

    【讨论】:

      猜你喜欢
      • 2021-02-25
      • 1970-01-01
      • 2014-07-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多