【发布时间】:2016-07-25 18:54:25
【问题描述】:
我有一个人口普查数据集,其中一些缺失的变量用? 表示,
当检查 R 中的不完整案例时,它说没有,因为 R 将 ? 作为有效字符。有什么方法可以将所有? 更改为NAs?我想使用mice包运行多重插补来填补缺失的数据。
【问题讨论】:
-
导入数据时定义na.strings。
标签: r na missing-data
我有一个人口普查数据集,其中一些缺失的变量用? 表示,
当检查 R 中的不完整案例时,它说没有,因为 R 将 ? 作为有效字符。有什么方法可以将所有? 更改为NAs?我想使用mice包运行多重插补来填补缺失的数据。
【问题讨论】:
标签: r na missing-data
数据帧。您可能需要摆弄引号。我没有测试过这个。
df[df == "?"] <- NA
【讨论】:
创建数据框df
df <- data.frame(A=c("?",1,2),B=c(2,3,"?"))
df
# A B
# 1 ? 2
# 2 1 3
# 3 2 ?
我。使用replace()函数
replace(df,df == "?",NA)
# A B
# 1 <NA> 2
# 2 1 3
# 3 2 <NA>
二。使用? 导入文件时
data <- read.table("xyz.csv",sep=",",header=T,na.strings=c("?",NA))
data
# A B
# 1 1 NA
# 2 2 3
# 3 3 4
# 4 NA NA
# 5 NA NA
# 6 4 5
【讨论】: