【发布时间】:2013-07-16 04:44:57
【问题描述】:
我有一个包含 679 行和 16 列的庞大数据集,其中 30% 的缺失值。所以我决定用 impute 包中的函数 impute.knn 来估算这个缺失值,我得到了一个包含 679 行和 16 列但没有缺失值的数据集。
但现在我想使用 RMSE 检查准确性,我尝试了 2 个选项:
- 加载包
hydroGOF并应用rmse函数 sqrt(mean (obs-sim)^2), na.rm=TRUE)
在两种情况下我有错误:errors in sim .obs: non numeric argument to binary operator.
发生这种情况是因为原始数据集包含 NA 值(缺少某些值)。
如果删除缺失值,如何计算 RMSE?那么obs 和sim 会有不同的大小。
【问题讨论】:
-
对不起。我也改写了这个问题。
-
您的
na.rm=T使用了错误的功能。它在sqrt,但需要在mean。