【问题标题】:How to handle missing values in linear regression?如何处理线性回归中的缺失值?
【发布时间】:2020-04-15 10:01:42
【问题描述】:

我有一个包含 60 个变量的数据框,并且所有变量都有缺失值,以至于没有一行是完整的:

complete.cases(data)
  [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [28] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [55] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [82] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE
[109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[136] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

所以我想我不能使用线性回归来估算缺失值。知道如何处理它们以便执行线性回归吗?

【问题讨论】:

    标签: r linear-regression missing-data


    【解决方案1】:

    处理缺失值可能包括:

    1. 最好省略掉大部分观测值的变量。

    2. 省略缺失值的行/观察/案例。该策略被称为列表删除或完整案例分析。这是一种可能,如果缺失的类型是MCAR(Missing Completely At Random),并且删除后仍然有足够大的样本。

    3. 不同的插补技术:均值/中值/模式替换、回归输入、期望最大化 (EM)、多重输入等。

    【讨论】:

      猜你喜欢
      • 2019-12-29
      • 2016-01-11
      • 2020-08-28
      • 1970-01-01
      • 2022-07-06
      • 2017-10-21
      • 2020-11-25
      • 2019-02-01
      • 1970-01-01
      相关资源
      最近更新 更多