【发布时间】:2020-08-10 10:01:46
【问题描述】:
我一直在尝试使用来自 Kaggle 的数据对 MICE 进行试验,但在分类变量的插补方面遇到了麻烦。我正在研究这个笔记本 - https://www.kaggle.com/rtatman/animal-bites 并试图预测物种(SpeciesIDDesc)。但是,在我运行 MICE 后,NA 值都没有改变。以下是我现在拥有的代码。
library(tidyverse)
library(lubridate)
library(mice)
#kaggle link with data - https://www.kaggle.com/rtatman/animal-bites
data <- read_csv("Health_AnimalBites.csv",
col_types = list(BreedIDDesc = col_character(),
release_date = col_datetime()))
data_mice_one <- data %>%
filter(!is.na(victim_zip),
!is.na(bite_date),
!is.na(victim_zip),
!is.na(WhereBittenIDDesc)) %>%
mutate(month = month(bite_date, label = TRUE)) %>%
select(SpeciesIDDesc,
victim_zip,
month)
imputed_data_one <- mice(data_mice_one, diagnostics = FALSE, remove_collinear = FALSE, meth="polyreg")
imputed_data_one <- complete(imputed_data_one)
view(imputed_data_one)
sum(is.na(imputed_data_one$SpeciesIDDesc))
在运行 'imputed_data_one 我是毒药 1 0 0 常数 SpeciesIDDesc 2 0 0 常量victim_zip
如何修复我的代码?我是否错误地使用了 MICE?
【问题讨论】:
标签: r imputation r-mice