【发布时间】:2020-11-02 23:30:08
【问题描述】:
我有一个data.frame,其中包含数百个变量,其中包含由 NA 表示的缺失值。总共有 571 个观测值。我只对data.frame 中的 20 个变量感兴趣。换句话说,我想将完整的观察定义为在所有 20 个感兴趣的变量中都有数据的任何观察。
解决此问题的一种方法是运行线性回归,这将删除任何具有缺失值的观察值。 IE。它会声明如下:
(196 observations deleted due to missingness)
这将使我能够推断出我的样本量等于 571 减去 196。但必须有更好的方法来做到这一点。有什么想法吗?
提前谢谢你!
【问题讨论】:
标签: r