【问题标题】:Nested random effects and related fixed effects嵌套随机效应和相关的固定效应
【发布时间】:2019-01-30 09:21:09
【问题描述】:

我有跨国面板数据,我想知道IV 对二元学生水平结果DV 的影响

我想包含一个嵌套随机效应,它考虑到学生所在的学校会影响结果,以及不同国家/地区的学校存在显着差异:(1|country/school)。所以我开始的模型是:

model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')

我还想考虑时间趋势。起初我认为我应该做年度固定效应,但这些国家的政治发展随着时间的推移而有很大差异,我想抓住这一点,虽然 1991 年可能使 A 国的学校陷入动荡,但 1991 年可能是教育资金的丰收年在 B 国。因此我认为我可能应该包括一个国家年固定效应,如下所示:

model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
                data=data, family = 'binomial')

模型的随机效应是:

Random effects:
 Groups          Name        Variance  Std.Dev. 
 school:country (Intercept) 5.703e-02 2.388e-01
 country         (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups:  school:country, 51; country, 22

当模型中已经包含国家随机效应时,包括国家年份固定效应是否不正确?

另一种提问方式: 我应该如何处理schoolcountry 的子集,country_yearcountry 的子集,但schoolcountry_year 都不是彼此的子集这一事实?

【问题讨论】:

  • 我认为您的问题更适合交叉验证

标签: r lme4 mixed-models nlme multilevel-analysis


【解决方案1】:

据我所知,您有 22 个国家/地区。目前尚不清楚country_year 是什么,但假设它只是country:year 的虚拟对象,那么将其作为固定效应(作为一个因素)包含在内可能不是一个好主意,因为会有太多水平解释有用。

由于您对时间趋势感兴趣,因此将year 包含为固定效果是有意义的:

DV ~ IV + (1|country/school) + as.factor(year)

如果有很多years,您可能会发现最好将年份包含为数字

DV ~ IV + (1|country/school) + as.numeric(year)

..因为这将估计一年的单一(线性)趋势,而如果它是一个因素,那么它将计算一个估计值,无论有多少年(减 1),当有很多级别。但是,当编码为一个因子时,估计值可以表明是否存在非线性趋势,然后您可以切换到 as.numeric 并引入非线性项。

OP 的最后一段有点混乱。如果country_year 真的嵌套在country 中,那么我们会有:

DV ~ IV + (1|country/school) + (1|country:country_year)

..这与:

DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)

...但是这不会估计任何时间趋势。如果您想估计一个趋势,那么您需要将year(或country_year)作为上述固定效应包括在内 - 您可以允许这在学校(和/或国家/地区)之间有所不同) 通过将其包含为随机斜率,例如:

DV ~ IV + year + (1|country) + (year|school:country)

【讨论】:

    猜你喜欢
    • 2021-04-04
    • 1970-01-01
    • 1970-01-01
    • 2015-09-26
    • 2022-11-27
    • 2020-06-30
    • 2022-01-05
    • 1970-01-01
    • 2013-05-03
    相关资源
    最近更新 更多