【问题标题】:caret train Error: At least one of the class levels is not a valid R variable namecaret train 错误:至少一个类级别不是有效的 R 变量名
【发布时间】:2019-06-29 10:13:35
【问题描述】:

我正在尝试运行

control = trainControl(
  method = "cv",
  number = 5,
  classProbs = TRUE,
  summaryFunction = twoClassSummary
  ) 

model_fit <-
  caret::train(
  Survived ~ .,
  data = train_cleaned_model_train,
  method = "glm",
  family = binomial(link = logit),
  preProc = c("knnImpute", "nzv"),
  metric = "ROC",
  trControl = control
  )

根据下面的结果,输入变量的名称似乎没问题

Classes ‘tbl_df’, ‘tbl’ and 'data.frame':   534 obs. of  9 variables:
 $ PassengerId: int  71 744 353 636 436 433 687 329 95 193 ...
 $ Survived   : Factor w/ 2 levels "0","1": 1 1 1 2 2 2 1 2 1 2 ...
 $ Pclass     : int  2 3 3 2 1 2 3 3 3 3 ...
 $ Sex        : chr  "male" "male" "male" "female" ...
 $ Age        : num  32 24 15 28 14 42 14 31 59 19 ...
 $ SibSp      : int  0 1 1 0 1 1 4 1 0 1 ...
 $ Parch      : int  0 0 1 0 2 0 1 1 0 0 ...
 $ Fare       : num  10.5 16.1 7.23 13 120 ...
 $ Embarked   : chr  "S" "S" "C" "S" ...

我看到了关于同一问题的其他问题。它们大多存在以特殊字符或数字开头的变量名称的问题。好像不是这样的。

谁能提供见解?

【问题讨论】:

标签: r r-caret model-fitting


【解决方案1】:

我意识到结果需要编码为字符变量,不能是数字 1 或 0。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-02-20
    • 1970-01-01
    • 1970-01-01
    • 2021-03-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多