【问题标题】:R-generate a "missing values variable"R-生成一个“缺失值变量”
【发布时间】:2013-05-21 18:59:06
【问题描述】:

我正在使用 R 为我正在教的统计课生成如何处理缺失数据的示例。一种方法需要生成一个“缺失值二进制变量”,其中包含缺失值的情况为 0,没有缺失值的情况为 1。例如

n  X  Y    Z  
1  4  300  2  
2  8  400  4  
3  10 500  7  
4  18 NA   10  
5  20  50  NA  
6  NA 1000 5  

我想生成一个变量M,这样

n m  
1 1  
2 1   
3 1  
4 0  
5 0  
6 0  

鉴于 R 处理缺失值的能力,这似乎应该很简单。我找到的最接近的是m <-ifelse(is.na(missguns),0,1),但这只是生成一个新的完整数据矩阵,其中 0 或 1 表示缺失。但是,我只想要一个变量来指示一行是否包含缺失值。

【问题讨论】:

    标签: r missing-data dummy-data


    【解决方案1】:

    complete.cases 完全符合您的要求。

    complete.cases(x)
    ## [1]  TRUE  TRUE  TRUE FALSE FALSE FALSE
    

    您可以强制转换为数字或整数:

    as.integer(complete.cases(x))
    ## [1] 1 1 1 0 0 0
    

    【讨论】:

    • 谢谢-成功了!作为更新,我正在实施 Rubin 的 t 检验。这是我生成的代码。数据集是“missguns”(“guns”数据集,但我包含了缺失值),其中一个变量是“urban”。缺失
    猜你喜欢
    • 2021-08-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多