【问题标题】:seed setting for train function in caret package for repeatedCV重复CV的插入符号包中训练函数的种子设置
【发布时间】:2018-01-02 09:37:47
【问题描述】:

我需要使用 R 中的插入符号包确定 KNN 模型的重复CV 的种子设置。

我的训练数据集有 12 列和 1000 行(二元响应中的第 1 列,其他 11 列是标准化的预测变量)

如何正确确定“repeatedCV”50 倍和 5 次重复的种子设置?

下面的种子设置是否正确?

有人可以帮助了解repeatCV 和LOOCV 的正确种子设置吗?

请看下面我的代码。

set.seed(123)
seeds <- vector(mode = "list", length = 251)
for(i in 1:250) seeds[[i]] <- sample.int(1000, 11) 

## For the last model:
seeds[[251]] <- sample.int(1000, 1)

【问题讨论】:

    标签: r set seed


    【解决方案1】:

    sample.int() 中的 11 应该是参数的#values。
    在这种情况下,如果您想在每个模型中评估 KNN 的 11 个 K 值,则选择 11。具体而言,您将在 10 次重复 CV 中获得 10 个模型进行平均。在 10 个模型中,train() 将尝试 11 个 K 值。
    2 个类似的问题已经有了很好的答案。
    Set seed parallel random forest in caret
    Fully reproducible parallel models using caret

    【讨论】:

      猜你喜欢
      • 2021-01-22
      • 2018-06-16
      • 2019-09-06
      • 2011-09-19
      • 1970-01-01
      • 2018-06-24
      • 1970-01-01
      • 2015-09-17
      • 2016-04-10
      相关资源
      最近更新 更多