【发布时间】:2023-03-15 01:13:01
【问题描述】:
我是 Tidy Models 的新手,到目前为止我很喜欢它,但对使用非公式接口进行重采样/交叉验证有疑问。到目前为止我理解它的方式,为了让我应用重采样()/交叉验证,我应该写一个
- 使用公式:结果 ~ 预测器
rf_rec <-
recipe(y_graduated ~ .,
data = trainDat_predSet)
- 指定型号
# Setting Random Forest Model Specifications
rf_model <-
rand_forest() %>%
set_engine("ranger") %>%
set_mode("classification") %>%
set_args(mtry = 3,
trees = 50,
min_n = 5)
- 创建折叠
set.seed(1234)
trainDatFolds <-
rsample::vfold_cv(data = trainDat, v = 5)
- 将配方和模型规范放入工作流中
rf_workflow <-
workflow() %>%
add_recipe(rf_rec) %>%
add_model(rf_model)
- 然后拟合重采样。
rf_workflow %>%
fit_resamples(resamples = trainDatFolds,
metrics = metric_set(roc_auc, pr_auc, accuracy),
control = control_resamples(save_pred = TRUE)
)
就我的目的而言,能够使用非公式接口的结果〜预测器要方便得多。
没有配方步骤,如果我正在重新采样拟合,我可以轻松使用该功能 - fit_xy() 指定 y - 结果和 x - 预测器集。
这是适合重采样的选项吗?
非常感谢!
【问题讨论】:
标签: r tidymodels