【问题标题】:MICE imputation troubleshooting in R with Categorical Variables使用分类变量在 R 中进行 MICE 插补故障排除
【发布时间】:2020-08-10 10:01:46
【问题描述】:

我一直在尝试使用来自 Kaggle 的数据对 MICE 进行试验,但在分类变量的插补方面遇到了麻烦。我正在研究这个笔记本 - https://www.kaggle.com/rtatman/animal-bites 并试图预测物种(SpeciesIDDesc)。但是,在我运行 MICE 后,NA 值都没有改变。以下是我现在拥有的代码。

library(tidyverse)
library(lubridate)
library(mice)

#kaggle link with data - https://www.kaggle.com/rtatman/animal-bites
data <- read_csv("Health_AnimalBites.csv", 
                 col_types = list(BreedIDDesc = col_character(), 
                                  release_date = col_datetime()))

data_mice_one <- data %>%
  filter(!is.na(victim_zip), 
         !is.na(bite_date), 
         !is.na(victim_zip), 
         !is.na(WhereBittenIDDesc)) %>%
  mutate(month = month(bite_date, label = TRUE)) %>%
  select(SpeciesIDDesc, 
         victim_zip, 
         month)

imputed_data_one <- mice(data_mice_one, diagnostics = FALSE, remove_collinear = FALSE, meth="polyreg")
imputed_data_one <- complete(imputed_data_one)
view(imputed_data_one)

sum(is.na(imputed_data_one$SpeciesIDDesc))

在运行 'imputed_data_one 我是毒药 1 0 0 常数 SpeciesIDDesc 2 0 0 常量victim_zip

如何修复我的代码?我是否错误地使用了 MICE?

【问题讨论】:

    标签: r imputation r-mice


    【解决方案1】:

    我刚刚意识到我忘记将 SpeciesIDDesc 和月份转换为因子。代码现在可以工作了

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-06-17
      • 2022-11-03
      • 1970-01-01
      • 1970-01-01
      • 2022-01-11
      • 1970-01-01
      相关资源
      最近更新 更多