【发布时间】:2014-01-27 02:34:16
【问题描述】:
我有一个包含缺失值的数据集,我可以使用不同的方法来估算缺失值。现在我想估计插补方法的准确性。但由于我不知道插补前的真实值是多少,所以我正在考虑将原始数据中的一些值屏蔽为“缺失值的数据”,然后使用我的常规插补方法。完成插补后,我可以将插补值与真实值进行比较,以估计插补精度。 所以,我的问题是:假设我想将数据集中的 100 个元素分配为 NA,如何选择 100 个不丢失的元素来为其分配 NA。那么,如何追踪这些元素以便进一步分析呢?
例子
library(BLR)
library(missForest)
data(wheat)
X2<- prodNA(X, 0.1) ## original “ data with 10 % missing values
X3<- missForest(X2)$Ximp ## imputed data set
【问题讨论】:
-
看看
?sample
标签: r