【发布时间】:2019-11-02 11:17:29
【问题描述】:
我有一个大型数据集(约 60k 行/观察,约 200 列/变量),并使用 lme4 使用一些变量运行了一系列广义线性混合模型 (glmm)。许多使用的变量都有缺失数据(我已经在适当的情况下使用插补或其他方法计算了大部分缺失数据,但仍然有很多),因此很明显,由于列表删除,许多行被排除在原始数据框中。
我现在需要做一些描述性统计工作(主要是频率,因为许多变量是有序/名义的)。
有没有一种简单的方法可以根据我给定的 glmms 中包含的观察结果来对原始数据框进行子集化?
调用模型中使用的数据很容易:
glmm1
但是,这只返回模型中使用的变量。我也想对该模型中未包含的变量(例如 var3 和 var4)进行描述性总结。
我可以编写一个从模型变量中排除 NA 的又长又脏的子集,但我认为必须有一个基本函数或包允许我通过 glmm 快速轻松地对 df1 进行子集。
(抱歉,如果这个问题已经得到解答,但我的搜索尝试只是让我了解如何在 lm 调用中使用子集功能)
【问题讨论】:
标签: r regression subset mixed-models