【发布时间】:2016-11-07 15:57:35
【问题描述】:
我正在尝试在 R 中使用 randomForest 包,但我遇到了一个问题,即 R 告诉我响应向量中缺少数据。
> rf_blackcomb_earlyGame <- randomForest(max_cohort ~ ., data=blackcomb_earlyGame[-c(1,2), ])
Error in na.fail.default(list(max_cohort = c(47, 25, 20, 37, 1, 0, 23, :
missing values in object
指定的错误很清楚。我以前也遇到过,过去确实有数据丢失,但这次没有任何数据丢失。
> class(blackcomb_earlyGame$max_cohort)
[1] "numeric"
> which(is.na(blackcomb_earlyGame$max_cohort))
integer(0)
我已尝试使用 na.roughfix 来查看是否有帮助,但出现以下错误。
Error in na.roughfix.data.frame(list(max_cohort = c(47, 25, 20, 37, 1, :
na.roughfix only works for numeric or factor
我检查了每个向量以确保它们都不包含任何 NA,并且它们都不包含。
有人有什么建议吗?
【问题讨论】:
-
你能显示
sapply(blackcomb_earlyGame, function(x) any(is.na(x)))的输出吗? -
我会努力的。我的 R 服务器崩溃了,重新启动它并重新加载数据。
-
很可能,您有一个字符类型的列。你能发布
str(blackcomb_earlyGame)的输出吗? -
是的,这似乎是问题所在。有一个专栏,我原以为我会选择一个因素,但它是一个角色。
-
@dww 请将此作为答案发布,以便 OP 可以接受它作为解决方案。另外,请考虑在未来提供一个可重现的示例。
标签: r random-forest