【问题标题】:How to use missForest package in R for test data?如何在 R 中使用 missForest 包获取测试数据?
【发布时间】:2015-11-18 22:33:06
【问题描述】:

我们基本上可以使用missForest包来估算R中的缺失值(对于分类和数字)。但是这种方法需要一个完整的响应变量来训练森林。那么,由于我们在测试数据集中没有任何响应变量,如何使用这个missForest包来估算测试数据集中的缺失值?

【问题讨论】:

    标签: r


    【解决方案1】:

    您可以只使用missForest。不需要响应变量。请参阅下面的代码。

    library(missForest)
    
    # remove response variable
    my_iris <- iris[, -5]
    
    ## Artificially produce missing values using the 'prodNA' function:
    set.seed(81)
    iris.mis <- prodNA(my_iris, noNA = 0.2)
    
    #impute
    iris.imp <- missForest(iris.mis, verbose = TRUE)
    #out of bag error
    iris.imp$OOBerror
    
    # not available if there is no response variable
    iris.imp$error
    
    # Imputed matrix
    iris.imp$ximp
    

    【讨论】:

      猜你喜欢
      • 2018-03-02
      • 2022-08-20
      • 2018-02-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-08-08
      • 2018-05-14
      相关资源
      最近更新 更多